Guide Comment se Débarrasser des Spams dans Google Analytics

Discussion dans 'Tracking' créé par Mehdi, 14 Décembre 2016.

  1. Mehdi

    Mehdi Overpaid Hobo

    Inscrit:
    19 Janvier 2016
    1 389
    $8.8k
    Guide Ultime :
    Comment se débarrasser des Spams dans Google Analytics


    Disclaimer : Le guide original a été créé par Carlos Escalera de Ohow.co, vous pouvez le consulter en anglais >
    Ultimate Guide to Getting Rid of the Spam in Google Analytics

    Ce que vous apprendrez :
    • Mythes sur le spam dans Google Analytics
    • La bonne façon de traiter le spam
    1. Protéger vos données des mauvaises configurations
    2. Arrêter les spams dans Google Analytics Spam et tout autre trafic indésirable

    a. Création d'un filtre Hostname valide pour Ghost Spam
    b. Création d'un filtre pour Crawler et langage spam dans Google Analytics
    c. Exclure le trafic interne
    d. Activer: "Exclure toutes les visites de robots et de spiders connues"
    3. Nettoyage de spam dans Google Analytics (données historiques)
    • Liste Historique de Spam (Crawler et Ghost).

    Le spam dans Google Analytics devient un casse - tête pour de nombreux utilisateurs qui comptent sur leurs analyses pour suivre la performance de leur entreprise et prendre des décisions importantes. Malheureusement, les spams qu'ils reçoivent ne leur facilitent pas la tâche !

    Est-ce que Google fait quelque chose?

    En réalité, oui. Cependant, Google Analytics est une cible très attrayante pour les spammeurs et dès que Google ferme une porte, les spammeurs trouvent une autre façon de passer à travers, comme la dernière vague de spam, qui utilise le langage et de faux domaines pour se faire passer pour de vrais sites.

    Comment le savoir?

    Même si il n'y a pas eu beaucoup d’annonces officielles de Google à ce sujet, si vous travaillez avec des dizaines de comptes Google Analytics comme je le fais, vous commencez à voir les modèles (après tout, c’est le job de tout analyste).

    Les graphiques suivants montrent tous les spams qui ont frappé ces 2 propriétés sur les deux dernières années. Les périodes marquées en rouge, montrent ce que je crois être les moments où Google a pris des mesures contre le spam.

    Malheureusement, il n'a pas fallu longtemps aux spammeurs pour répondre et aussitôt les spams se répandaient à nouveau.

    DosQTTH.png

    La bonne nouvelle est que vous pouvez éviter la plupart des spams si vous consacrez un peu plus de temps et d'efforts dans votre Analytics.

    Je vais vous montrer les solutions que j’ai appliqué à tous mes Analytics et à plus de 400 sites que j'ai personnellement aidé. Il a été prouvé que ces filtres fonctionnaient pendant presque 2 ans quelles que soient les tactiques utilisées par les spammeurs. Voici quelques exemples :

    PBoG2jM.png

    - Les données en bleu dans le segment ne montrent que le spam dans la propriété.
    - La ligne orange représente le moment où les filtres de ce guide ont été appliqués à cette propriété.
    Comme vous pouvez le voir le spam a arrêté depuis.

    Donc, je vais vous montrer ce dont vous aurez besoin pour obtenir ces résultats dans votre Analytics. Mais avant ça, nous allons voir ce que vous ne devriez pas faire.


    Mythes sur le spam dans Google Analytics
    Il y a beaucoup de mythes sur la façon de gérer le spam. Certains vous feront perdre votre temps, tandis que d'autres peuvent compliquer les choses encore plus, donc si vous avez fait l'une des erreurs ci-dessous, annulez ces modifications si possible.

    • Ne créez pas de filtres d'exclusion simples pour chaque spammeur. C'est extrêmement inefficace et peut devenir un vrai bordel
    • Ne pas utiliser la liste d'exclusion de référence pour le spam ; cela va juste compliquer la question encore plus!
    • N'utilisez pas de solutions côté serveur pour Ghost Spam, elles n'auront aucun effet (plugins WordPress, .htaccess, etc.)
    • Ne vous inquiétez pas du spam endommageant votre référencement ou votre classement. Il n'y a pas de réels backlinks vers votre site et Google n'utilise pas les données de Google Analytics.
    La bonne façon de traiter les spams
    Je vais vous montrer non seulement comment vous débarrasser du spam et tout trafic indésirable, mais aussi comment le faire en toute sécurité afin que vous ne risquiez pas vos données, et ce de manière efficace, de sorte que vous ne perdiez pas votre temps dans les mises à jour des filtres chaque fois que le nouveau spam apparaît.
    Voici ce que vous allez accomplir au moment où vous mettrez en œuvre les instructions de ce guide:

    1. Protégez vos données: configurez correctement vos vues pour protéger vos données des erreurs de configuration possibles.
    2.
    Arrêtez le spam et tout autre trafic indésirable:

    • Filtrer Ghost Spam
    • Filtres Crawler Spam
    • Filtrer Language Spam
    • Exclure Good Bots
    • Filtrage du trafic interne
    3. Nettoyer vos données historiques: Créez un segment avancé pour supprimer le spam de vos données historiques

    1. Protéger vos données contre des erreurs de configuration

    Cette étape n'est pas strictement nécessaire pour nettoyer vos analyses, mais il est toujours important de se protéger contre les erreurs de configuration possibles.

    Chaque compte Google Analytics doit avoir au moins les vues suivantes :

    • Master - Affichez où vous allez appliquer les filtres utilisé pour l'analyse
    • Unfiltered - Votre vue de sauvegarde, qui, ne devrait pas avoir de filtre ou de paramètre qui modifie les données entrantes.
    • Test (facultatif) - si vous voulez être plus prudent, vous pouvez créer une vue de test que vous pouvez utiliser pour essayer les filtres.
    Si vous suivez déjà ces bonnes pratiques, passez à l'étape suivante. Dans le cas contraire, vous trouverez ici les instructions sur la création d'une vue non filtrée et testée!

    2. Arrêter le Spam dans Google Analytics et autre trafic indésirable

    Lorsque vous serez sûrs que vos données sont protégées, la prochaine étape est de bloquer tout ce trafic indésirable qui gonfle vos rapports.

    Voici ce que vous allez faire:
    1. Filtre pour Ghost Spam (arrêtera toute référence de formulaire, organique, page, langage)
    2. Filtre pour Crawler Spam.
    3. NOUVEAU! Filtre pour Language Spam.
    4. Filtre pour le trafic interne, contenant toutes les adresses IP utilisées par vous ou votre équipe.
    5. Activez la fonctionnalité intégrée Bot Filtering (pour exclure les bots connus)
    Remarques générales sur les filtres
    • Bien que la plupart du temps les filtres commencent à fonctionner en quelques minutes, officiellement il faut jusqu'à 24 heures pour que les effets de filtre deviennent visibles dans vos données, soyez patient!
    • Vous pouvez appliquer les filtres soit dans la vue principale (les vues à utiliser pour l'analyse), soit dans la vue test si vous voulez les essayer en premier.

    2a. Création d’un filtre Hostname valide pour Ghost Spam

    Ce filtre empêche la plupart des spams; des sites comme tous les ShareButton, faux sites de conformité de cookie, site-auditeur, et la plupart des "secret.Google.com" spam.

    La principale caractéristique du Ghost spam est qu'il ne visite jamais votre site. Au lieu de cela, il utilise le protocole de mesure pour atteindre directement votre GA. Pour cette raison, ce type de spam laisse toujours un faux hostname ou laisse un nom d'hôte "indéfini" qui apparaîtra comme (non défini) dans vos rapports.

    Si nous l'utilisons pour créer un filtre qui ne laisse que passer le trafic avec des noms d'hôte valides, tout le trafic fantôme sera automatiquement exclu. Cette solution est beaucoup plus efficace que celle couramment utilisée, qui est de créer un filtre avec le nom de spam.

    De plus, cette technique fonctionne pour tout type de référence, mot-clé, page, langage, etc


    QUw0DKA.png

    Il y’a une chose que je tiens à préciser car elle peut parfois causer un peu de confusion. Certaines personnes confondent le Hostname avec la source.

    La source est d'où votre visite vient et il peut y en avoir plusieurs, par exemple, Facebook, Google, Twitter, Youtube, des liens d'autres sites vers votre site, etc

    Le nom d'hôte, d'autre part, est le site où le visiteur arrive. Votre nom d'hôte principal sera votre domaine et, en fonction de la configuration de votre site, il pourrait y en avoir d'autres.

    YPcTZqh.png


    Ce filtre sera pour vos noms d'hôte, quelque chose que vous contrôlez et que vous pouvez compter avec vos mains. Donc, tant que vous les ajoutez tous vous n'avez pas à vous inquiéter, vous n'excluez aucun trafic réel.

    Cette partie du guide peut être la plus compliquée, mais elle est aussi la plus importante pour se débarrasser du spam et elle peut même aider à éliminer d'autres sources de trafic indésirable. Il existe 3 parties pour construire ce filtre:

    1. Trouvez vos noms d'hôte: Pour accéder à la liste des noms d'hôtes, vous devez accéder au rapport de réseau dans votre Analytique et sélectionner le texte bleu "Noms d'hôte" en haut des rapports. Faites une liste de ceux qui sont valides.
    2. Créez votre Hostname Expression: Une fois que vous avez la liste de tous vos noms d'hôte, vous devez créer une expression régulière (REGEX) qui les contient tous. Il est important d'ajouter tous vos noms d'hôte pertinents sinon vous courrez le risque de perdre des données valides. Pour vous assurer que vous n’avez rien raté, vous pouvez tester votre expression avec un segment rapide.
    3. Créez le filtre Hostname valide: Une fois que vous êtes sûr que l'expression est correcte, il sera temps de créer le filtre pour se débarrasser une fois pour toutes de Ghost Spam.

    2b. Création d'un filtre pour Crawler et Language Spam dans Google Analytics

    Qu'est-ce que le Crawler spam?

    Les Crawler spam sont plus difficiles à détecter car ils utilisent un nom d'hôte valide. Vous aurez donc besoin d'un filtre différent avec une expression qui correspond à tous les crawler spam connus.

    Pour gagner du temps, j'ai créé un REGEX optimisé pour les crawler spam que vous trouverez ci-dessous dans les instructions, mais si vous préférez, il peut être construit de la même manière qu’un hostname expression valide. Cette fois, vous utiliserez le nom source (referrer).

    Comment arrêter Crawler Referrer Spam dans Google Analytics
    Pour arrêter le spam de referrer, vous devez créer un filtre d'exclusion à l'aide de la source de la campagne:
    1. Accédez à l'onglet Admin.
    2. Sous la dernière colonne "VIEW", sélectionnez Filtres, puis cliquez sur + Ajouter un filtre
    3. Entrez "Crawler Spam" comme nom.
    4. Type de filtre> Personnalisé> Exclure
    5. Champ de filtrage> Source de campagne
    Yz1Jasy.png

    6. Filtre Motif> Coller le texte suivant : crawler spam expression
    Les expressions suivantes sont optimisées pour bloquer tous les Crawler spam détectés au cours des deux dernières années.

    Créer 1 filtre pour chaque expression :

    # Expression 1
    (best|dollar|success|top1)\-seo|(videos|buttons)\-for|anticrawler|^scripted\.|semalt|forum69|7makemon|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|uptime(bot|check|\.com)
    # Expression 2
    datract|hacĸer|ɢoogl|responsive\-test|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter
    # Expression 3 pour LANGUAGE SPAM
    Suivez les mêmes étapes, mais au lieu de "Source de campagne", sélectionnez Paramètres de langue
    \s[^s]*\s|.{15,}|\.|,

    Vous pouvez cliquer sur Vérifier ce filtre pour avoir un aperçu rapide de son fonctionnement.

    Vous ne pourrez voir le spam de référence que sur le côté gauche de la table de prévisualisation. En raison de petits échantillons de données utilisés par cette fonctionnalité pour tester le filtre, il est très probable que vous obteniez le message suivant:
    « This filter would not have changed your data. Either the filter configuration is incorrect, or the set of sampled data is too small»

    Si vous avez suivi attentivement les instructions, ne vous inquiétez pas; le filtre fonctionnera. Sinon, vous pouvez vérifier le filtre avec un segment rapide.


    7. Quand tout est prêt :Sauvegarder

    2c. Exclure le trafic interne


    Bien que ce type de trafic ne soit pas du spam, il peut être aussi dangereux pour vos analyses. Si vous n'appliquez pas de filtres pour le trafic généré par vous ou par d'autres personnes de votre équipe, ces données seront mélangées avec vos données de visites réelles, et contrairement au spam, c'est beaucoup plus difficile à identifier plus tard.
    Pour créer ce filtre, vous aurez besoin de l'IP publique du réseau / wifi que vous souhaitez exclure. Vous pouvez le trouver ici. Vous verrez quelque chose comme ceci 12.345.678.90 ou la version plus longue IPv6

    Si vous avez besoin d'aide pour construire ce filtre et d'autres méthodes, vous pouvez trouver des instructions complètes dans ce post.


    2d. Activer: "Exclure tous les coups de bots et spiders connus"

    Il existe de nombreux autres robots qui ne représentent pas de spam, mais qui ne sont pas utiles pour vos rapports. Par exemple, ceux qui recherchent votre site pour l'indexation. Ces robots vont laisser un enregistrement dans vos rapports s’ils ne sont exclus. Dans ce cas, c'est un peu plus facile car Google Analytics dispose d'une fonctionnalité intégrée pour exclure ce trafic.

    Comment activer le filtrage de bot

    Répétez les étapes suivantes pour toutes vos vues :

    1. Encore une fois, dans l'onglet Admin, sélectionnez une de vos vues de la colonne VIEW dans la section admin.
    2. Cliquez sur Afficher les paramètres
    HmDL31V.png

    3. En bas, cochez la case Exclure tous les résultats de bots et spiders connus (Filtrage des bots)
    g6n7pB3.png

    4. Enregistrez et répétez le processus avec toutes vos vues​

    3. Nettoyage des Spam dans Google Analytics (données historiques)

    Le spam qui est déjà stocké dans votre Analytics (ou toute autre donnée) ne peut pas être définitivement supprimé. C'est pourquoi il est important de créer les filtres pour arrêter de recevoir du trafic indésirable.


    Toutefois, vous pouvez toujours nettoyer vos données affectées par le spam en utilisant un Hostname Expression valide que vous avez créé précédemment ainsi qu’un segment avancé.

    Comment supprimer le Spam des données historiques de Google Analytics

    Pour éliminer le spam de vos données historiques Google Analytics, vous devrez créer un segment avancé:
    1. Dans la section Rapports, cliquez sur la case qui indique Tous les utilisateurs (en haut du graphique). Cliquez ensuite sur le bouton rouge + NOUVEAU SEGMENT
    2. Dans la fenêtre de segment, en bas cliquez sur Conditions 0AfNvFF.png
    3. Première condition:
      a. Filtre> Sessions> Inclure
      b. Dropdown 1> Hostname
      c. Dropdown 2> correspond à regex
      d. Textbox> Collez le Hostname Expression que vous avez précédemment utilisé pour le filtre.
    4. Cliquez + Ajouter un filtre en bas pour ajouter une nouvelle condition.
    5. Deuxième condition:
      a. Filtrer> Sessions> Exclure
      b. Dropdown 1> Source
      c. Dropdown 2> correspond à regex
      d. Textbox> Coller le Crawler Spam expression

    L'expression suivante est optimisée pour nettoyer tous les Crawler spam détectés au cours des deux dernières années.
    (best|dollar|success|top1)\-seo|(videos|buttons)\-for|anticrawler|^scripted\.|\-gratis|semalt|forum69|7make|sharebutton|ranksonic|sitevaluation|dailyrank|vitaly|profit\.xyz|rankings\-|dbutton|\-crew|uptime(bot|check|\.com)|datract|hacĸer|ɢoogl|responsive\-test|torrent\-to|magnet\-to|dogsrun|tkpass|free\-video|keywords\-monitoring|pr\-cy\.ru|fix\-website|checkpagerank|seo\-2\-0\.|platezhka|timer4web|share\-buttons|99seo|3\-letter

    6. Cliquez sur le bouton Ou à gauche de la condition que vous venez de configurer
    7. Troisième condition (Pour exclure le nouveau Language Spam)
    • Dropdown 1> Language
    • Dropdown 2> correspond à regex
    • Textbox> Coller l’expression de l’Anti-language Spam \s[^s]*\s|.{15,}|\.|,
    8. Entrez « All users- clean » comme nom pour le segment et Enregistrer.

    Après avoir sauvegardé le segment, vous pourrez voir des rapports sans spam, tant que le segment est sélectionné. Au fur et à mesure, les filtres feront leur travail, et vous n'aurez plus besoin d'utiliser le segment.

    Conclusion
    Google Analytics est un outil puissant qui vous aidera à comprendre votre trafic, mais il faudra un peu de travail si vous voulez vous assurer de recevoir des données propres et fiables. Autrement, vous pourriez aller dans la mauvaise direction.

    En appliquant ces solutions, vous vous assurez que vous recevrez des données précises. Voici un exemple d'un des comptes. L'image montre une comparaison des données avec puis sans Spam et trafic indésirable.

    D761aTY.png
     
    Dernière édition: 14 Décembre 2016
  2. Nicolas

    Nicolas Actif

    Inscrit:
    24 Mai 2016
    69
    55
    $453
  3. adilero

    adilero Actif

    Inscrit:
    14 Octobre 2016
    97
    43
    $682
    Mille merci MehdiMehdi on ne peut pas te remercier tant... Grand boulot, chapeau:peace::)
     
    Mehdi aime ça.
  4. jon66

    jon66 Apprenti

    Inscrit:
    13 Novembre 2016
    29
    10
    $180
    Ce post tombe bien, je commence à avoir pas mal de requêtes du style "trump" etc...
    J'ai du boulot sur la planche.
     
    Mehdi aime ça.
Brouillon sauvegardé Brouillon supprimé

Ce site utilise des cookies, cliquer sur OK indique votre accord.