Hinweis: Dieser Artikel wurde erstmals 2015 auf rebelytics.com veröffentlicht und wurde seitdem aktualisiert und in diesen Blog verschoben.
Spam-Traffic in Google Analytics ist in letzter Zeit ein großes Thema in der digitalen Marketing-Community gewesen. Vor allem seit der Einführung von Universal Analytics hat der Spam-Traffic drastisch zugenommen. Das liegt daran, dass Universal-Analytics-Konten viel einfacher zu spammen sind als klassische Google-Analytics-Konten, ein Problem, auf das wir später in diesem Artikel eingehen werden.
Es wurde schon viel über Spam-Traffic in Google Analytics geschrieben und es gibt viele nützliche Ressourcen, die dir helfen, das Problem zu lösen. Einige der vorgeschlagenen Lösungen scheinen jedoch irreführend zu sein, weil sie das Problem nicht richtig verstehen. Deshalb konzentriert sich dieser Artikel darauf, das Problem in einfachen Worten zu erklären, bevor er einige Lösungsvorschläge zur Beseitigung von Spam-Traffic bespricht und einige neue Ideen hinzufügt.
Werfen wir zunächst einen Blick darauf, wie Spammer tatsächlich Daten in deine Google Analytics-Konten bekommen. Soweit ich weiß, gibt es zwei Möglichkeiten, Google Analytics-Konten zu spammen:
- Webcrawler, die Websites mit Google Analytics-Trackingcodes besuchen
- Direkte Dateneinfügung in Google Analytics-Konten über das Messprotokoll
Wir werden zunächst die Theorie hinter den beiden Arten des Spammings von Google Analytics-Daten erörtern, bevor wir über mögliche Lösungen sprechen.
Spamming von Google Analytics-Konten mit Webcrawlern
Webcrawler oder Bots sind Softwareprogramme, die automatisch viele Websites im Internet besuchen. Die meisten Webcrawler haben nützliche Funktionen, wie z. B. der Googlebot, der alle Websites durchsucht, die er finden kann, und Google dabei hilft, das gesamte Web zu indexieren. Besuche von Webcrawlern werden normalerweise nicht von Google Analytics erfasst, weil sich Crawler als Crawler und nicht als echte Nutzer identifizieren und weil sie nicht daran interessiert sind, Tracking-Codes auf den von ihnen besuchten Websites auszuführen.
Einige Spammer nutzen Webcrawler, um die Daten in deinem Google Analytics-Konto zu manipulieren. Sie schicken einen Webcrawler auf deine Website, der sich als echter Nutzer ausgibt, Tracking-Codes ausführt und deshalb von Google Analytics erfasst wird. Darüber hinaus gibt der Webcrawler vor, von einem Link zu kommen, der von einer anderen Domain auf deine Website verweist. Diese Links existieren normalerweise nicht, aber die Domains, auf denen die Links angeblich zu finden sind, sind echt und gehören den Spammern.
Aber was haben die Spammer davon? Indem sie Besuche von ihren eigenen Domains auf Tausenden oder sogar Millionen von Google Analytics-Konten simulieren, generieren sie eine beträchtliche Menge an Traffic auf ihren eigenen Websites. Google Analytics-Nutzer wollen herausfinden, woher der neue, unerwartete Traffic kommt, also überprüfen sie die Domains, die in ihren Verweisberichten erscheinen. Ich bin mir sicher, dass du das selbst schon mindestens einmal gemacht hast.
Die Spammer freuen sich über all diesen Traffic, denn sie verdienen Geld mit den Anzeigen, die sie auf ihren Websites schalten. So einfach ist das!
Schauen wir uns jetzt eine neue, einfachere und raffiniertere Methode an, um Google Analytics-Konten zu spammen.
Spamming von Google Analytics-Konten durch Einfügen von Daten über das Messprotokoll
Wie ich bereits zu Beginn dieses Artikels erwähnt habe, ist Spam-Traffic seit der Einführung von Universal Analytics zu einem noch größeren Problem geworden. Eine der besten Neuerungen von Universal Analytics ist das Measurement Protocol, eine Schnittstelle, mit der du von jedem beliebigen System aus Daten in dein Google Analytics-Konto einfügen kannst, ohne den klassischen Tracking-Code zu benötigen, den wir alle vom Website-Tracking kennen.
Das Measurement-Protokoll macht Google Analytics viel leistungsfähiger als zuvor, denn es ermöglicht eine einfache Integration verschiedener Systeme in das Tracking deiner Website. Ein Beispiel für eine Tracking-Funktion, die seit der Einführung des Measurement-Protokolls viel einfacher zu implementieren ist, ist das Tracking von Telefonanrufen. Anbieter von Anrufverfolgung können jetzt über eine einfache HTTP-Anfrage Daten in dein Google Analytics-Konto einfügen und alle Dimensionen und Metrikdaten einbeziehen, die auch ein normaler Seitenaufruf oder ein Ereignis auf deiner Website enthalten würde.
Vielleicht weißt du schon, worauf das hinausläuft: Das Measurement Protocol ist zwar die leistungsstärkste Neuerung von Universal Analytics, aber es ist auch seine größte Schwachstelle. Jeder kann alles an dein Google Analytics-Konto senden! Alles, was sie brauchen, ist deine Tracking-ID, und schon kann es losgehen.
Die meisten Spam-Besuche, die du in deinem Google Analytics-Konto siehst, haben also gar nicht auf deiner Website stattgefunden, sondern jemand hat über das Measurement Protocol durch eine einfache HTTP-Anfrage Daten an dein Google Analytics-Konto gesendet. Mit dieser Methode können die Spammer jede beliebige Dimension oder Metrik manipulieren. Deshalb siehst du bei Measurement Protocol-Spam nicht nur Spam-Domains in deinem Verweisungsbericht, sondern auch in deinem Ereignisbericht oder in deinem Bericht über organische Suchbegriffe.
Wenn du wissen willst, wie das Measurement-Protokoll im Detail funktioniert, empfehle ich dir, dich mit Googles Messprotokoll Hit Builder ein bisschen. Ich fordere dich auf, eine Spam-Nachricht an die Google Analytics-Daten dieser Website zu schicken!
Das Ziel der Spammer, die die Measurement-Protocol-Methode verwenden, ist das gleiche wie das Ziel derjenigen, die Webcrawler einsetzen: Sie wollen dich auf ihre Websites neugierig machen, indem sie ihre Domainnamen an allen möglichen Stellen in deinem Google Analytics-Konto auftauchen lassen. Wenn du ihre Websites besuchst, verdienen sie Geld mit den Anzeigen, die sie schalten.
Wie kannst du verhindern, dass deine Google Analytics-Konten zugespammt werden?
Nachdem wir nun besprochen haben, wie Spammer Daten in dein Google Analytics-Konto einschleusen und warum sie das tun, wollen wir uns nun einige Lösungen ansehen, um den unerwünschten Traffic in deinen Statistiken loszuwerden. Wir werden uns einige der Ratschläge ansehen, die im Internet zu finden sind (einschließlich einiger wirklich schlechter Ratschläge), und ich werde die Lösung vorstellen, die meiner Meinung nach am besten geeignet ist, um den über das Measurement Protocol eingefügten Spam-Traffic zu bekämpfen.
Fangen wir mit den schlechten Ratschlägen an, damit du von Anfang an weißt, was du bei Spam-Traffic NICHT tun solltest.
Verwende NICHT die Referral-Ausschlussliste, um Referral-Spam auszuschließen
Die Verweisausschlussliste ist wie das Messprotokoll eine weitere Funktion von Google Analytics, die mit Universal Analytics eingeführt wurde und in der klassischen Version nicht vorhanden war. Ihre Hauptfunktion besteht darin, zu verhindern, dass eine neue Sitzung beginnt, wenn Nutzer/innen die getrackte Website verlassen, um eine Aktion durchzuführen, die auf einer anderen Domain gehostet wird, und dann auf die getrackte Website zurückverwiesen werden.
Eine klassische Anwendung dafür ist die Bezahlung über externe Anbieter. Wenn du deine Website-Besucher zu paypal.com schickst, um ihre Einkäufe in deinem Online-Shop zu bezahlen, und Paypal sie dann zurück auf deine Website schickt, wird ihre Rückkehr als neuer Besuch von paypal.com angezeigt, und dein Empfehlungsbericht sieht so aus, als würde Paypal dir viele kaufende Kunden schicken.
Um dies zu verhindern, kannst du paypal.com und die Domains anderer Zahlungsanbieter, mit denen du zusammenarbeitest, in deine Referral-Ausschlussliste aufnehmen. Wenn nun ein Nutzer von paypal.com auf deine Seite kommt, prüft Google Analytics, ob dieser Nutzer bereits eine Sitzung auf deiner Website begonnen hat. Wenn dies der Fall ist, wird die offene Sitzung fortgesetzt und die Rückkehr der Nutzerin oder des Nutzers auf deine Website wird nicht als neuer Besuch gezählt und ihre oder seine Quelle wird nicht als paypal.com vermerkt, sondern als die Quelle der bereits begonnenen Sitzung.
Wenn Google Analytics hingegen einen Nutzer erkennt, der von paypal.com kommt und noch keine Sitzung auf deiner Website begonnen hat, wird der Besuch als neuer Besuch gezählt und der Verweis “paypal.com” wird weggelassen. Der Besuch wird also als direkter Besuch gezählt.
Aus diesem Grund solltest du nie, nie, nie Spam-Besuche in deine Ausschlussliste für Empfehlungen aufnehmen! Die Spam-Besuche werden zwar immer noch gezählt, aber anstatt sie als Verweisbesuche von Spam-Domains zu zählen, zählt Google Analytics sie als direkte Besuche. Das verschlimmert das Problem, anstatt es zu lösen. Jetzt kannst du nicht einmal mehr zwischen Spam-Besuchen und echten Direktbesuchen oder echten Besuchen aus anderen Quellen unterscheiden, die aus technischen Gründen als Direktbesuche gezählt werden.
Was auch immer du also tust, um Spam-Traffic in Google Analytics zu bekämpfen, verwende NICHT deine Referral-Ausschlussliste, um das Problem zu lösen, auch wenn dieser Ratschlag in den seriösesten Quellen zu finden ist. Er wird dir nicht helfen, sondern dein Spam-Problem nur noch verschlimmern.
Werfen wir nun einen Blick auf einen weiteren schlechten Ratschlag, der in Ressourcen zu finden ist, die sich mit dem Problem von Spam-Traffic in Google Analytics-Konten befassen.
Verwende KEINEN Länderfilter, um Spamverkehr auszuschließen
Genau wie der nutzlose Ratschlag mit der Empfehlungsausschlussliste ist dies eine weitere sehr schlechte Idee, über die ich in verschiedenen ansonsten seriösen Quellen gelesen habe. Einige Digitalvermarkter scheinen zu glauben, dass das Filtern des Traffics aus “obskuren” Ländern das Problem lösen wird. Was sie nicht bedenken, ist, dass es in diesen Ländern echte Internetnutzer/innen gibt, die an deiner Website und deinen Dienstleistungen interessiert sein könnten, genauso wie es eine Menge Spam-Traffic gibt, der als Traffic aus deinem eigenen Land auftaucht.
Die Verwendung eines Hostnamen-Filters kann riskant sein und ist nicht wirklich notwendig
Eine der Lösungen, die in den meisten Ressourcen zu diesem Thema vorgeschlagen wird, ist die Verwendung eines Hostnamenfilters für deine Google Analytics-Daten, der nur gültige Hostnamen enthält. Das ist eine ziemlich gute Lösung, aber sie ist bei weitem nicht perfekt und birgt einige Risiken. Sie hilft dir, den meisten Measurement Protocol-Spam auszuschalten, denn die Spammer, die Daten in dein Google-Konto pushen, kennen deinen Domainnamen nicht wirklich. Sie generieren Google Analytics Tracking-IDs nach dem Zufallsprinzip und verwenden zufällige Hostnamen in ihren Treffern oder oft auch ihre eigenen Domains.
Die Hostnamen-Filterlösung schlägt vor, dass du nur Treffer in deine Google Analytics-Daten aufnimmst, die deinen eigenen Hostnamen haben, zusammen mit einigen anderen “guten” Hostnamen, wie Google Translate. Und genau an dieser Stelle wird die Lösung extrem unzuverlässig. Wer weiß, welche anderen “guten” Hostnamen in Zukunft auftauchen werden, weil andere Unternehmen ähnliche Dienste wie Google Translate anbieten werden, bei denen deine Inhalte unter einem anderen Hostnamen gehostet werden, zum Vorteil der Nutzer und ohne Schaden für dein Unternehmen?
Niemand braucht diese Lösung wirklich, denn es gibt eine viel bessere Möglichkeit, Messprotokoll-Spam zu beseitigen, die sehr effektiv funktioniert und kein Risiko für die Qualität deiner Daten darstellt. Lass uns jetzt einen Blick auf diese Lösung werfen.
Werde den Messprotokoll-Spam ein für alle Mal los
In der Agentur für digitales Marketing, für die ich früher gearbeitet habe, haben wir eine schnelle, saubere und einfache Lösung zur Beseitigung von Measurement Protocol-Spam entwickelt. Alles, was du zum Einrichten dieser Lösung brauchst, ist der Google Tag Manager.
Wenn du den Google Tag Manager noch nicht verwendest und immer noch Tracking-Codes für Google Analytics direkt im Quellcode deiner Website platzierst, solltest du das JETZT ändern. Es gibt nur wenige Argumente dafür, den Google Tag Manager nicht mit Google Analytics zu verwenden. Du kannst viele tolle Sachen zu deiner Google Analytics-Konfiguration hinzufügen, wenn du den Google Tag Manager verwendest, und die Qualität deiner Daten verbessert sich erheblich.
Das Einrichten eines Spam-Traffic-Filters für das Messprotokoll mit dem Google Tag Manager ist einfacher, als es klingt. Alles, was du tun musst, ist, alle Hits, die du kontrollierst, eindeutig zu identifizieren und alle anderen Hits, die diese Identifikation nicht tragen, auszuschließen. Das kannst du erreichen, indem du in einer benutzerdefinierten Dimension einen bestimmten Wert für alle Hits angibst, die auf deiner Website passieren. Zu den Treffern gehören Seitenaufrufe, Ereignisse, Transaktionen und alle anderen Interaktionen deines Tracking-Codes mit den Google Analytics-Servern.
Im Google Tag Manager fügst du diesen Wert, den du selbst definierst, einfach zu einer benutzerdefinierten Dimension in all deinen Google Analytics Tags hinzu. Stell dir diesen Wert als dein Passwort vor, obwohl er nicht kryptisch oder sicher sein muss. Er ist nur eine Identifikation für dich, die dir hilft, alle Treffer zu erkennen, die du kontrollierst.
Jetzt richtest du diese benutzerdefinierte Dimension in deinem Google Analytics-Konto ein und erstellst einen Filter für die Datenansicht, mit der du arbeitest, der nur Treffer enthält, die den von dir in der benutzerdefinierten Dimension festgelegten Wert tragen. Du wirst sehen, dass von nun an kein Measurement Protocol-Spam mehr in deinen Daten auftaucht, weil die Spammer dein Passwort nicht kennen und Google Analytics die von ihnen erzeugten Treffer filtert.
Hier ist eine Schritt-für-Schritt-Anleitung für das, was ich gerade beschrieben habe:
Schritt-für-Schritt-Anleitung für die Einrichtung eines Spamfilters mit Google Tag Manager
Füge in Google Analytics eine neue benutzerdefinierte Dimension hinzu und nenne sie “Passwort” oder so ähnlich:

Sobald du die benutzerdefinierte Dimension gespeichert hast, merkst du dir die Indexnummer, die Google Analytics ihr zugewiesen hat. Du brauchst diese Nummer für den Google Tag Manager im nächsten Schritt:

Wenn du eine Google Analytics-Einstellungsvariable verwendest, richte im Google Tag Manager eine benutzerdefinierte Dimension mit der Indexnummer, die du dir im vorherigen Schritt gemerkt hast, und einem von dir gewählten Passwort ein. Kopiere das Passwort in deine Zwischenablage:

Wenn du keine Google Analytics-Einstellungsvariable verwendest, stelle einfach sicher, dass du diese benutzerdefinierte Dimension in jedem Google Analytics-Tag einrichtest, das du verwendest.
Als Nächstes kehrst du zu Google Analytics zurück und richtest einen Filter für deine Datenansicht ein, der nur Treffer enthält, die den Wert des Passworts haben, das du in deine Zwischenablage in der von dir eingerichteten benutzerdefinierten Dimension kopiert hast:

Das war's! Deine Google Analytics-Daten sind jetzt vor Spam-Verkehr geschützt, der über das Measurement Protocol eingeschleust wird, denn nur Treffer, die dein Passwort enthalten, werden in deiner gefilterten Datenansicht angezeigt.
Wenn du Fragen zur Einrichtung hast, zögere bitte nicht, einen Kommentar unter diesem Artikel zu hinterlassen. Ich werde dir gerne helfen!
Wichtiger Hinweis: Wenn du selbst das Measurement Protocol verwendest, um Daten für bestimmte Tracking-Funktionen, wie z. B. die Verfolgung von Telefonanrufen, an Google Analytics zu übermitteln, musst du sicherstellen, dass du in diesen Treffern auch deinen Identifikationswert (Passwort) angibst.
Wie du siehst, ist es sehr einfach, Spam-Traffic auszuschließen, der über das Messprotokoll in dein Konto gelangt. Aber was ist mit der anderen Art von Spam-Traffic, die wir besprochen haben? Der Webcrawler-Spamverkehr ist viel schwieriger zu bekämpfen, aber wir sollten nicht aufgeben! Wir werden uns jetzt die Möglichkeiten ansehen, wie wir diese Art von Spam-Verkehr bekämpfen können.
Ausschlussfilter für Verweise verwenden, um Crawler-Spam zu eliminieren
Wenn du die oben beschriebene Lösung zum Filtern von Spam-Traffic mit dem Messprotokoll eingerichtet hast, wirst du feststellen, dass der Spam-Traffic in deinem Konto drastisch abnimmt, aber einige Besuche von obskuren Verweisen werden weiterhin angezeigt. Das sind Besuche, die tatsächlich auf deiner Website stattgefunden haben, aber nicht von echten Nutzern, sondern von Crawlern, die vorgeben, echte Nutzer zu sein.
Die Lösung, die ich derzeit verwende, besteht darin, diese Überweisungen wöchentlich oder monatlich zu identifizieren (je nach Größe des Kontos) und sie mithilfe von Filtern aus der Datenansicht, den benutzerdefinierten Berichten und Dashboards auszuschließen. Das funktioniert gut, ist aber natürlich mühsam, weil es viel Zeit in Anspruch nimmt, deshalb suche ich nach einer automatisierten Lösung.
Ein Tool, das es wert ist, ausprobiert zu werden, und das verspricht, das Problem zu lösen, dass du deinen Empfehlungsbericht regelmäßig manuell überprüfen und bereinigen musst, ist Simo Ahavas Tool zum Einfügen von Spamfiltern. Lass mich wissen, wenn du getestet hast, wie gut es funktioniert!
Was ist mit der Google Analytics-Einstellung “Alle Treffer von bekannten Bots und Spidern ausschließen”?
Diese Standardfunktion von Google Analytics, die du in den Einstellungen der Datenansicht im Admin-Bereich deines Google Analytics-Kontos findest, ist eine recht nützliche Idee, hat aber in Wirklichkeit keine großen Auswirkungen. Du kannst es selbst testen, indem du eine Datenansicht mit aktivierter Funktion und eine andere Datenansicht ohne diese Einstellung erstellst. Du wirst sehen, dass der Unterschied nur gering ist. Die Verwendung dieser Einstellung ist auf jeden Fall eine gute Idee, aber du bist weit davon entfernt, das Problem zu lösen.
Wie sieht die Lösung der Zukunft aus?
Für die Zukunft hoffe ich auf eine Lösung, die nicht in der Bekämpfung von Spam besteht, sondern darin, echte Nutzer besser zu identifizieren. Wenn wir echte Nutzerinnen und Nutzer auf einer Website anhand ihres Verhaltens identifizieren können, können wir nur echte Nutzerinnen und Nutzer berücksichtigen und Spam komplett ignorieren.
Es gibt bereits einige sehr schöne und hilfreiche Skripte, die das Nutzerverhalten messen (und uns gleichzeitig, ohne dass dies ihr Hauptzweck ist, dabei helfen, echte Nutzer zu identifizieren), wie das brillante Vernietet von Rob Flaherty.
Wenn es uns gelingt, ein Tool wie dieses zu entwickeln, das 100% zuverlässig auf allen Gerätetypen funktioniert, müssen wir uns keine Sorgen mehr über Spam-Traffic in Google Analytics machen. Wir werden einfach Segmente mit unseren echten Nutzern erstellen und analysieren, was sie auf unseren Seiten tun.
Zusammenfassung der 25 Kommentare
Zusammenfassung der Leserkommentare und Antworten der Autoren
Der Blogbeitrag löste eine interessante Diskussion unter den Lesern aus, die sich mit Spam in Google Analytics und den besten Methoden zum Filtern von Junk-Traffic auseinandersetzten. Im Folgenden findest du einen klaren, strukturierten Überblick über die hilfreichsten Themen und interessantesten Fragen, die aufgeworfen wurden - zusammen mit Ratschlägen des Autors, die auch dir helfen können.
1. Tools und Taktiken zur Spam-Filterung entwickeln sich weiter
Mehrere Leser haben bemerkt, dass einige beliebte Spam-Tools (wie das von Simo Ahava) abgeschaltet wurden oder vorübergehend nicht mehr funktionieren. Der Autor und die Ersteller der Tools meldeten sich mit Status-Updates und Alternativen. Jason von Quantable zum Beispiel erklärte, dass er seinen Spam-Filter repariert hat und teilte seinen Ansatz mit, räumte aber ein:
“Die Pflege einer großen Liste von bösen Akteuren, wie es mein Filter tut (und die aktualisiert werden muss), ist viel mehr laufende Arbeit als das Hinzufügen eines Schlüssels über GTM.”
Mitnehmen:
Filter-Tools ändern sich - überprüfe immer, ob eine Ressource auf dem neuesten Stand ist und teste, bevor du dich auf eine einzige Lösung verlässt.
2. Grenzen der GTM-basierten Methoden
Ein aufmerksamer Leser hat uns auf eine mögliche Schwachstelle in der Passwort/Schlüssel-Methode zum Filtern von Spam über den Google Tag Manager hingewiesen:
“Das wird Spammer nicht aufhalten, wenn sie deine Seite inspizieren... Sie könnten den Index dort sehen und ihn einfach zu ihrem Messprotokoll-Treffer hinzufügen, um den Spam an Google Analytics weiterzuleiten.”
Der Autor stimmte zu, beruhigte aber:
“Da diese Spammer normalerweise nur automatisch Tracking-IDs generieren und sich nicht wirklich um die Websites kümmern, die sie spammen, sollte das normalerweise kein Problem sein.”
Mitnehmen:
Keine Methode ist 100% kugelsicher, aber der meiste GA-Spam ist generisch. Der GTM/Passwort-Ansatz schreckt alle außer den gezieltesten Angriffen ab.
3. Praktischer Filteraufbau - Häufige Fallstricke
Mehrere Nutzer berichteten von Problemen mit Filtern, die keinen Verkehr erzeugen, oder von Segmenten, die anders funktionieren als Filter. Der Autor hat hilfreiche Checklisten zur Fehlerbehebung bereitgestellt:
- Prüfe, ob die benutzerdefinierte Dimension die Daten korrekt verfolgt
- Bestätige, ob du den Filter auf eine neue oder bestehende Datenansicht angewendet hast (neue Ansichten haben keine historischen Daten!)
- Fehler in der Filterkonfiguration sind oft der Grund dafür
Mitnehmen:
Überprüfe deine Umsetzung immer schrittweise - beginne mit Segmenten auf historischen Daten und wende dann Filter an.
4. Umgang mit seltsamem oder verdächtigem Nutzerverhalten
Ein Teilnehmer beschrieb rätselhafte, wiederholte Besuche von Nutzern, die nie konvertierten, und fragte:
“Ich habe das Gefühl, dass da draußen eine Armee ist, die die ganze Seite tag-teamt... als ob sie einem Algorithmus folgt, um den Schnüffeltest gegen Spammer zu bestehen. Auweia! Das ist frustrierend. Hast du das gesehen?”
Die unterstützende Antwort des Autors:
- Es ist üblich, Ausreißer zu beobachten - seien es Mitarbeiter, Bots oder echte, aber seltsame Nutzer.
- Die meisten Bots führen keine GA-Skripte aus, aber einige schon.
- Versuchen Sie Skripte wie Vernietet um das menschliche Engagement (Scrollen usw.) zu verfolgen und die Analysen dann nach Verhalten zu segmentieren, um Menschen von Bots zu unterscheiden und sich auf Qualitätsdaten zu konzentrieren.
Mitnehmen:
Kümmere dich nicht um unbedeutende, unerklärliche Unregelmäßigkeiten im Datenverkehr. Verfolge stattdessen “echtes” Verhalten mit zusätzlichen Signalen und konzentriere dich auf saubere, verwertbare Daten.
5. Technische Klarstellungen zu Google Analytics & GTM
Neue und erfahrene Leserinnen und Leser fragen:
- Welchen Feldnamen soll ich für benutzerdefinierte Dimensionen (“Passwort”) in Filtern verwenden?
Benutzerdefinierte Abmessungen erscheinen am Ende des Dropdown-Feldes für Filter.
- Wie kann ich sicherstellen, dass benutzerdefinierte Abmessungen für alle Tags gelten?
Verwende GA-Einstellungsvariablen, damit du nur an einer Stelle benutzerdefinierte Dimensionen einrichten musst und nicht in jedem Tag.
- Warum wird bei einigen Tags die Option für benutzerdefinierte Abmessungen angezeigt, bei anderen aber nicht?
Wahrscheinlich, weil die anderen Tags eine GA-Einstellungsvariable verwenden.
Mitnehmen:
Richte benutzerdefinierte Dimensionen über GA-Einstellungsvariablen ein und verwalte sie, wo immer es möglich ist, um Klarheit und Effizienz zu schaffen.
6. Erkennen und Filtern von Empfehlungsspam
Einige Leser fragten nach dem Filtern von fremden Domains (z. B.
qq.stylrh.tw). Der Autor hat daran erinnert:
“Es ist schwer zu sagen, ob es sich um Spam handelt und welche Art von Spam es ist, wenn man sich die Domains ansieht.”
Bei plötzlichen Ausschlägen aus neuen Ländern (Indien, Pakistan) wiesen sie darauf hin, dass mehr Informationen für eine Diagnose benötigt werden, und boten an, die Nutzerdaten per E-Mail zu überprüfen.
Mitnehmen:
Nicht jeder seltsame Datenverkehr ist Spam - prüfe, bevor du handelst, und wende dich im Zweifelsfall an Experten.
Zusammenfassung der in der Diskussion angesprochenen Best Practices:
- Überprüfe immer den aktuellen Stand der Spam-Tools und -Filter; erwarte Veränderungen.
- GTM “Passwort”-Filter halten die meisten Spams ab, sind aber nicht unbesiegbar - kombiniere Methoden.
- Teste die Filterung mit Segmenten, bevor du sie in den Live-Filtern aktivierst.
- Verwende Verhaltensskripte (wie Riveted), um nicht-menschlichen Verkehr herauszufiltern.
- Verwende Google Analytics Einstellungsvariablen, um die Verwaltung benutzerdefinierter Dimensionen einfach zu halten.
- Untersuche verdächtigen Datenverkehr anhand von Daten, nicht nur durch Domain-Lookups.
25 Antworten
Das ist eine ziemlich coole Lösung, schön!
Du beziehst dich auf das Spam-Tool von Simo Ahava, aber er hat das Tool inzwischen vom Netz genommen und gesagt, dass es bessere Wege gibt, das Problem zu lösen.
Hallo Rick,
Vielen Dank für die Vorwarnung! Ich hatte nicht bemerkt, dass das Tool abgeschaltet wurde. Ich werde es überprüfen und den Artikel aktualisieren, sobald ich die Gelegenheit dazu habe.
Ich habe ein Werkzeug gefunden, das hier gut zu funktionieren scheint:
https://www.adwordsrobot.com/en/tools/ga-referrer-spam-killer
Zuvor habe ich benutzt:
https://www.quantable.com/analytics/google-analytics-referral-spam-filter-wizard/
aber aus irgendeinem Grund scheint es jetzt nicht mehr zu funktionieren, ich weiß nicht, ob es nur an mir liegt.
Vielen Dank, Tony!
Hallo Tony - ich bin der Autor des Quantable-Spamfilters, der tatsächlich kaputt war, nicht nur bei dir (meine Firewall hat die Oauth-Rückmeldung von Google blockiert). Jetzt sollte er wieder funktionieren. Vielen Dank!
Mein Spam-Filter prüft, welche Hostnamen Datenverkehr erhalten, so dass das Risiko eines Hostnamen-Filters reduziert wird.
Guter Artikel, ich stimme mit den Empfehlungen überein. Das Führen einer großen Liste böser Akteure, wie es mein Filter tut (und das Aktualisieren erfordert), ist viel mehr Arbeit als das Hinzufügen eines Schlüssels über GTM.
Vielen Dank, Jason. Es ist eine große Ehre für mich, dass du hier kommentierst. Ich bin schon seit langem ein großer Fan deiner Arbeit.
Mit der “Schritt-für-Schritt-Anleitung zum Einrichten eines Spamfilters mit dem Google Tag Manager” werden Spammer nicht aufgehalten, wenn sie deine Seite inspizieren, richtig? Sie könnten den Index dort sehen und ihn einfach zu ihrem Messprotokoll-Hit hinzufügen, um den Spam an Google Analytics weiterzuleiten.
Hallo Jason,
Ja, das ist absolut richtig! Es wäre möglich, das Passwort auf der Website zu finden und den Filter zu umgehen. Da diese Spammer normalerweise nur automatisch Tracking-IDs generieren und sich nicht wirklich um die Websites kümmern, die sie spammen, sollte das normalerweise kein Problem sein.
Hallo Eoghan,
Sehr interessant. Daran habe ich nie gedacht.
Ich habe das auf meiner Website ausprobiert und es scheint als Segment zu funktionieren. Aber nicht als Filter (=0 Traffic).
Hast du eine Idee, warum das der Fall ist? Ich habe deine Schritte sorgfältig befolgt 🙂 .
Hallo Arno,
Wenn die Lösung als Segment funktioniert, bedeutet das, dass die Daten in Google Analytics korrekt getrackt werden, wobei der Wert “Passwort” in einer benutzerdefinierten Dimension enthalten ist. Der Grund dafür, dass der Filter nicht funktioniert, könnte also ein Fehler in der Filterkonfiguration sein.
Hast du den Filter auf eine bestehende Datenansicht angewendet und die Ansicht hat dann aufgehört, den Verkehr zu verfolgen? Oder hast du eine neue Ansicht mit diesem Filter erstellt und es gab keinen Datenverkehr in der Ansicht? In letzterem Fall könnte das daran liegen, dass neue Ansichten nie historische Daten enthalten. Wenn du ein bisschen wartest, solltest du Daten ab dem Zeitpunkt sehen, an dem du die Ansicht erstellt hast.
Wenn dir das nicht weiterhilft, kannst du mir gerne weitere Informationen geben, damit ich sie mir genauer ansehen kann.
Mit freundlichen Grüßen,
Eoghan
Hallo Eoghan,
Genialer Vorschlag. Ich arbeite mit einem E-Commerce-Kunden zusammen, der derzeit etwa 150-200 Zugriffe pro Tag hat, hauptsächlich von neuen Nutzern. Letztes Jahr haben sie $1 Million Umsatz gemacht, aber das war unrentables PPC (buchstäblich kein Gewinn und die PPC-Firma sagte immer, die Antwort sei, mehr Geld auszugeben!) Ich versuche, sie wieder auf dieses Niveau zu bringen, aber das Geld in der Tasche zu behalten, also tue ich mein Bestes, um alles so sauber wie möglich zu machen, damit meine Experimente legitime Daten haben, um größere Investitionen in SEO und PPC sowie eine Überarbeitung des Website-Designs zu validieren. Ich habe einen Hostnamen-Filter und einen Empfehlungs-Spam-Filter für die Kampagnenquelle mithilfe von Regex-Ausdrücken von Carlos Escalera eingerichtet.
Da der Datenverkehr nicht groß genug ist, um sofort einen Unterschied durch diese Filter zu erkennen, habe ich ein Segment zum Testen eingerichtet und es mit historischen Daten verglichen. Zu meiner Überraschung fand das Segment in den 3 Monaten, in denen ich mit diesem Kunden arbeite, nur etwa 7 Nutzer, die als Spam identifiziert wurden. Im letzten Jahr waren es zwar über 500, aber ich denke, dass es sich dabei eher um Klickbetrug handelte, da der Kunde mehr Adwords schaltete, bevor ich an Bord kam.
Ich glaube aber nicht, dass es in den letzten drei Monaten nur 7 Spam-Nutzer auf der Seite gab. Also bin ich auch deinem Vorschlag gefolgt. Anstatt es als Filter einzurichten, habe ich mit einem Segment begonnen. Bis jetzt liefert es mir null Daten, also denke ich, dass ich etwas falsch gemacht habe, denn in der Zeit, in der das meine “passwortgeschützte” Dimension in Analytics/Tag Manager läuft, haben Leute die Seite besucht.
Unabhängig davon, ob ich das richtig gemacht habe (ich werde es noch einmal durchgehen), habe ich niemanden gefunden, der über das Problem spricht, das ich zu lösen versuche: Ich habe Kunden, die ein- bis viermal am Tag vorbeikommen, normalerweise an Werktagen, manchmal hunderte Male über Monate hinweg, und nie etwas kaufen. (Es handelt sich um eine Website für Industriezubehör für Drähte und Kabel - niemand macht einen Schaufensterbummel bei diesem Zeug. Nach dem Preis, klar, aber irgendwann würdest du aufhören, bei uns einzukaufen, wenn wir immer zu teuer wären.) Wie viele von ihnen können echte Nutzer sein? Einige springen jedes Mal ab, wenn sie auftauchen, und einige scheinen ein rechtmäßiges Verhalten zu haben, wie der User Explorer zeigt, aber warum sollten sie die Website besuchen und fast jeden Tag nach einem anderen Produkt suchen?! Das ergibt keinen Sinn. Ich habe das Gefühl, dass die Website von einem Bot oder einer Art Ausbeutungsprogramm angegriffen wird, das ich nicht verstehen kann.
Ungültige Hostnamen sind gering. Auch der ungültige Referral-Traffic ist ziemlich gering. Wo soll ich anfangen? Ich habe diese verrückte, gleichmäßige Verteilung von Nutzern, die ein paar von tausenden Seiten einmal besuchen und dann wieder abspringen (und wie gesagt, einige Nutzer springen nicht einmal ab, sondern bleiben und sehen sich mehr als eine Seite an), aber es sind viele Nutzer. Ich habe das Gefühl, dass da draußen eine ganze Armee ist, die die ganze Seite abklappert. Ein Nutzer verbringt sogar alle paar Tage etwa 25 Minuten auf der Seite, als würde er einem Algorithmus folgen, um den Schnüffeltest gegen Spammer zu bestehen. Auweia! Das ist frustrierend. Hast du das gesehen?
Hallo Mike,
Vielen Dank für deine interessante Frage. Ich vermute, dass du auf den meisten Websites einige Nutzer mit ungewöhnlichem Verhalten findest: Mitarbeiter des Unternehmens, Entwickler und Auftragnehmer, die an der Website arbeiten, Kunden oder Geschäftspartner, die die Website aus anderen Gründen als dem Kauf besuchen, usw... Und es gibt auch einige Crawler und Bots, die das GA-Tracking-Skript ausführen (die meisten tun das nicht, so dass 99% der Bots nicht einmal in GA auftauchen).
Mir fällt es oft schwer, diese Dinge zu ignorieren und mich auf die wirklich wichtigen Kennzahlen zu konzentrieren, daher verstehe ich deine Bedenken absolut.
Eine Methode, mit der ich gute Erfahrungen gemacht habe, ist die Verwendung von Skripten, die das tatsächliche Nutzerverhalten messen und identifizieren (z. B. die Scroll-Aktivität), wie dieses hier: https://riveted.parsnip.io/
Sobald du das eingerichtet hast, kannst du ein Segment mit Sitzungen von echten Nutzern (die echtes Nutzerverhalten zeigen) und ein anderes ohne (wahrscheinlich Bots, die GA ausführen) erstellen. Auch wenn du auf diese Weise die Bots und Crawler nicht identifizieren kannst, ist es zumindest eine Möglichkeit, dich auf gute Daten zu konzentrieren und den Rest auszuschließen.
Ich hoffe, das hilft dir. Bitte lass mich wissen, wenn ich noch etwas für dich tun kann.
Mit freundlichen Grüßen,
Eoghan
Danke, Eoghan. Eine weitere hilfreiche Antwort. Ich bin wohl etwas zu besorgt wegen dieses Nutzerverhaltens, und da es kein Muster gibt, das andere in Bezug auf ähnlichen illegalen Traffic sehen, muss ich annehmen, dass es echt ist. Dein Vorschlag, das Scrollen mit einem Skript zu messen, ist also eine gute Idee. Ich werde daran weiterarbeiten.
Hey!
Wie lautet der Name des Feldes? Ich kann das Passwort nicht finden 🙁.
Mit dem neuen Ansichtsfilter meine ich...
Hallo Dalia,
Sobald du die neue benutzerdefinierte Dimension für das Kennwort erstellt und ihr einen Namen gegeben hast (“Kennwort” im obigen Beispiel, du kannst aber auch einen anderen Namen verwenden), findest du diesen Namen im Ansichtsfilterfeld ganz unten im Dropdown-Menü (benutzerdefinierte Dimensionen werden immer ganz am Ende angezeigt).
Ich hoffe, das hilft dir! Bitte lass mich wissen, wenn du weitere Fragen hast.
Hallo, ich bin ein Neuling hier.
Ich bekomme eine Menge Traffic von vielen Domains wie dieser:
qq.stylrh.tw
qq.stylebo.ytw
Sind all die Dinge, über die ihr hier sprecht, gut, um diese Art von Verkehr zu filtern?
Ups, ich habe einen Fehler gemacht:
viele Domains wie diese:
qq.stylrh.tw
qq.stylebo.tw
Hallo Alejandro,
Es ist schwer, anhand der Domains zu erkennen, ob es sich um Spam handelt und um welche Art von Spam es sich handelt. Wenn du möchtest, kannst du mir eine E-Mail mit mehr Informationen schicken und ich schaue es mir gerne an.
Wir haben gerade angefangen, “Traffic” aus einer Vielzahl von Nicht-US-Ländern, hauptsächlich Indien und Pakistan, für eine neue Seite auf unserer Website zu bekommen. Normalerweise bekommen wir täglich etwa 100-150 Sitzungen, heute Morgen um 8 Uhr sind es über 300, hauptsächlich aus Indien. Das kommt alles von Google/Organic oder Direct, ohne neuen Referral-Traffic. Klingt das nach demselben Problem, das du beschrieben hast? Wir müssten GTM einrichten, um die Lösung auszuprobieren.
Vielen Dank im Voraus!
-Calvin
Hallo Calvin,
Vielen Dank für deine Frage. Ohne zusätzliche Informationen ist es schwer zu sagen, ob dieser Traffic über das Messprotokoll eingegeben wird, ob es ein Bot ist, der deinen Tracking-Code ausführt, oder ob es einen anderen Grund gibt. Wenn du möchtest, dass ich mir das ansehe, kannst du mir gerne weitere Informationen schicken (Screenshots deiner GA-Daten usw.). Ich verstehe, dass du GTM nur nutzen musst, um die oben beschriebene Lösung auszuprobieren, also wäre es sinnvoll, zuerst sicherzustellen, dass es sich tatsächlich um Messprotokoll-Spam handelt.
Mit freundlichen Grüßen,
Eoghan
Hallo! Vielen Dank für diesen Artikel! Wenn du das Folgende sagst:
Wenn du keine Google Analytics-Einstellungsvariable verwendest, stelle einfach sicher, dass du diese benutzerdefinierte Dimension in jedem Google Analytics-Tag einrichtest, das du verwendest.
Meinst du die Auswahl aus der Dropdown-Liste für den Non Interaction Hit?
Ich glaube, ich muss sie zu all meinen Tags hinzufügen, deshalb frage ich mich das. Danke!
Hallo Jessica,
Vielen Dank für deine Frage. Dieser Satz bezieht sich auf zwei verschiedene Optionen, die du im GTM hast, um verschiedene Einstellungen in GA-Tags anzupassen. Vor ein paar Jahren, als es noch keine GA-Einstellungsvariablen gab, musstest du Dinge wie benutzerdefinierte Dimensionen oder IP-Anonymisierung in jedem einzelnen GA-Tag (Seitenaufrufe, Ereignisse usw.), das du benutzt hast, einstellen. Mit den GA-Einstellungsvariablen kannst du jetzt alle Einstellungen an einem Ort verwalten. Dieser Satz in meinem Artikel ist nur für Leute, die noch keine GA-Einstellungsvariablen verwenden.
Ich hoffe, das hilft dir! Bitte lass mich wissen, wenn du weitere Fragen hast.
Hallo Eoghan!
Toller Artikel!
Ich konnte “Custom Dimensions” nur in einem meiner Tags im Google Tag Manager-Konto finden. Es handelt sich um das Universal Analytics-Tag, dessen “Tracking-Typ” auf “Pageview” eingestellt ist. In den anderen Tags, die ich für verschiedene Ereignisse auf meiner Website habe und deren “Tracking-Typ” auf “Ereignis” eingestellt ist, kann ich die Option "Benutzerdefinierte Abmessungen" jedoch nicht finden.
Kannst du mir sagen, was ich hier übersehe?
Vielen Dank im Voraus!
/Jolita
Hallo Jolita,
Möglicherweise verwendest du eine Google Analytics-Einstellungsvariable für die anderen GA-Tags. In diesem Fall hast du die benutzerdefinierten Dimensionen in der GA-Einstellungsvariable und nicht in den Tags selbst festgelegt.
Ich hoffe, das beantwortet deine Frage! Bitte lass mich wissen, wenn etwas unklar bleibt.