Supprimer le spam de Google Analytics

Vous avez constaté dans les rapports de votre compte Google Analytics que des sites étranges comme traffic2cash.xyz, copyrightclaims.com, black-friday.ga ou snip.to sont répertoriés dans la liste des sites qui vous envoient du trafic (sites référents) ?

Il s’agit de spammeurs qui n’ont d’autre but que d’essayer de vous attirer chez eux, et qui au passage faussent vos statiques de visites, notamment votre taux de rebond, votre durée moyenne de visite et votre nombre total de visiteurs.

Je vous propose donc de voir comment supprimer le spam referrer de votre compte Analytics.

referrer spam analytics
Exemples de spam Google Analytics ( referrer spam)

Ghost Spam ou Crawler Spam ?

Il convient de distinguer 2 types de spam de référent dans Analytics : le ghost spam et le crawler spam. Faire la distinction est important, car la méthode anti-spam que l’on va utiliser pour s’en prémunir varie en fonction du type de spam auquel on est confronté.

Le Ghost spam ou visite fantôme, consiste pour le spammeur à envoyer de fausses données directement aux serveurs de Google Analytics. Il n’y a donc aucune visite réelle sur votre site. C’est pour cela que l’on parle de visiteurs « fantômes ». D’ailleurs, il est possible que le spammeur ne sache même pas qu’il a atteint votre site, ou tout du moins il ne vous visait pas spécifiquement car les données fictives sont envoyées à des numéros de comptes Analytics générés de façon aléatoire.

En résumé, cela signifie que votre ID Google Analytics est utilisé par le spammeur pour polluer vos propres statistiques grâce au protocole de mesure d’Analytics.

Pour ce type de spam, les techniques de protection utilisant le fichier htaccess ou un plugin s’avèrent inefficace étant donné qu’aucun robot ne vient parcourir vos pages.

Le crawler spam désigne cette fois d’un vrai robot qui va venir se balader sur vos pages et être comptabilisé comme un internaute lambda. La plupart du temps, ce genre de robots à l’origine du spam de référents ignore les indications du fichier robots.txt. Il est donc impossible de les bloquer de cette manière.

 

1 – Le fichier htaccess

Pour stopper le crawler referrer spam, nous allons utiliser le fichier htaccess. Grâce aux instructions que nous allons entrer dans le htaccess, nous allons bloquer les bots avant même qu’ils n’arrivent sur notre site.

Il vous suffit de rajouter ces lignes, en adaptant les noms de domaines par ceux auxquels vous êtes confrontés :

## bloquer le spam des sites référents

RewriteCond %{HTTP_REFERER} 100dollars-seo.com [NC,OR]

RewriteCond %{HTTP_REFERER} best-seo-offer.com [NC,OR]

RewriteCond %{HTTP_REFERER} buttons-for-your-website.com [NC]

RewriteRule .* – [F]

 

La liste des principaux crawlers

Voici une liste qui regroupe les principaux domaines recensés comme étant effectuant du crawler spam.

Attention, n’essayez PAS de visiter les sites de cette liste avec votre navigateur !

(voir plus bas dans l’article mon explication « Que recherchent les spammeurs » )

⇒ 100dollars-seo.com

⇒ 7makemoneyonline.com

⇒ anticrawler.org

⇒ baixar-musicas-gratis.com

⇒ best-seo-offer.com

⇒ best-seo-solution.com

⇒ buttons-for-website.com

⇒ buttons-for-your-website.com

⇒ dailyrank.net

⇒ descargar-musica-gratis.net

⇒ forum69.info

⇒ semalt.com

⇒semalt.semalt.com

⇒semaltmedia.com

⇒ sitevaluation.org

⇒ success-seo.com

⇒videos-for-your-business.com

 

 

2 – Le filtre Analytics

La mise en place de filtres va nous permettre de lutter contre le spam de visiteurs fantômes.

Avant toute chose, nous allons créer une nouvelle vue sur Analytics afin de toujours en avoir une non filtrée. En effet, les conséquences de l’application du filtre seront irréversibles. Disposer en permanence d’une vue non filtrée vous permettra d’avoir une « sauvegarde » au cas où vous feriez une mauvaise manipulation avec la vue filtrée.

Cliquez sur « Admin », dans le 3 ème volet « vue », déroulez la liste et choisissez « créer une vue »

création d'une nouvelle vue google analytics

Donnez un nom précis à cette vue et cliquez sur « créer une vue »

nouvelle vue de rapports Analytics

Nous allons maintenant mettre en place le filtre Analytics.

Toujours dans « Admin », allez dans « filtres », puis cliquez sur « ajouter un filtre »

ajouter un filte analytics

Cochez la case « créer un  filtre »  et donnez lui un nom explicite, par exemple : Spam Referral

ajouter un nouveau filtre de vue Analytics

Type de filtre : choisissez « personnalisé »

Champs de filtrage : tapez « source de la campagne »

Règle de filtrage : complétez avec les noms de domaines qui spamment, séparés par une barre verticale (touches du clavier : contrôle alt 6 )

Par exemple : get-your-social-buttons.info|adf.ly|copyrightclaims.org|snip.to

Malheureusement, le champ de saisie du filtre est limité à 255 caractères. Il vous faudra donc créer un autre filtre si vous avez beaucoup de faux sites référents…

Cliquez ensuite sur « vérifier ce filtre » pour avoir un aperçu des changements avant d’enregistrer.

vérification du filtre analyticsLa vidéo suivante (réalisée par le site botcrawl.com ) vous montre un exemple de mise en place d’un filtre (ici pour le domaine copyrightclaims.org)

 

La liste non exhaustive des ghost spam de Google Analytics

Pour vous aider à compléter votre filtre, voici une liste de quelques domaines qui envoient des visiteurs fantômes.

Attention, n’essayez PAS de visiter les sites de cette liste avec votre navigateur !

⇒ black-friday.ga

⇒ cyber-monday.ga

⇒ traffic2cash.org

⇒ traffic2cash.xyz

⇒ get-your-social-buttons.info

⇒ adf.ly

⇒ snip.to

⇒ copyrightclaims.org

⇒ best-seo-software.xyz

⇒ alibestsale.com

⇒ o-o-8-o-o.com

⇒ o-o-6-o-o.com

⇒ ilovevitaly.com

⇒ hosting-tracker.com

⇒ lsex.xyz

⇒ hulfingtonpost.com

⇒ darodar.com

 

 

3 – La mise en place d’un segment

Pour nettoyer l’historique de nos données, nous allons maintenant utiliser un segment.

Allez sur la vue d’ensemble de votre compte, et cliquer sur « ajouter un segment »

Sélectionnez « conditions »

Ajouter un filtre comme ceci : « inclure » « nom d’hôte » « contient » et indiquer votre nom de domaine

Ajouter un second filtre comme ceci : « exclure » « sources » « correspond à l’expression régulière » et indiquer les noms de domaines des spammeurs.

nouveau-segment-analytics

Une fois le segment mis en place, affichez uniquement ce segment de façon à ne plus voir aucun spam.

Le site saystoptospam.org propose également un segment tout prêt à l’emploi comprenant plus de 400 sites de spam référents que vous pouvez télécharger dans votre Analytics.

Je vous mets ci-dessous la vidéo de saystoptospam.org qui explique très brièvement comment utiliser leur segment.

 

La technique à éviter :

Sur certains sites, on vous propose d’utiliser la liste d’exclusion de sites référents pour supprimer les faux sites référents. Le problème si vous utiliser cette fonctionnalité d’Analytics, c’est que vous aller simplement déplacer le problème : le trafic référents en provenant des spammeurs va être transformé en trafic direct. Lorsqu’il vous faudra alors déterminer entre 2 visiteurs directs lequel est un spammeur et lequel est internaute légitime, vous risquez d’avoir quelques difficultés…

liste d'exclusion de sites referents

 

Que recherchent les spammeurs d’Analytics ?

La réponse est simple : à vous attirer sur leur site. En effet, lorsque l’on consulte ses statistiques Analytics et que l’on remarque qu’un site référent nous envoie soudainement de nombreux visiteurs, on a généralement envie d’en savoir plus sur ce site d’où proviennent nos internautes.

Lorsque l’on se rend sur le site en question, le spammeur obtient ce qu’il recherchait : pose d’un cookie d’affiliation, redirection vers un site de fishing, visionnage de publicité, voir éventuellement tentative d’infection de votre ordinateur par un cheval de Troie…

 

Quels sont les conséquences et les risques du spam ?

Nous l’avons vu, le principal problème provient des données que l’on tire de Google Analytics et qui sont faussées par les fausses visites. Explosion du taux de rebond, forte hausse du trafic du jour au lendemain… De quoi vous empêcher d’évaluer correctement la qualité des visites reçues.

Pas d’inquiétude pour votre site en revanche : ces fausses visites n’ont aucun impact sur votre référencement ou sur la sécurité du serveur. Le problème concerne avant tout Google Analytics.

A noter toutefois que les crawlers peuvent provoquer une surcharge inutile de votre serveur, et donc vous faire perdre un peu de bande passante et de ressources.

Souhaitez vous évaluer cet article ?

6 réflexions sur “Supprimer le spam de Google Analytics”

  1. J’apprends que si tu utilises la fonctionnalité de liste d’exclusion des sites référents (partie technique à éviter) ça se transforme en trafic direct.
    J’avais justement un conseiller Google au téléphone, plus spécialisé Adwords qu’Analytics selon ses dires, il m’avait dit d’utiliser cette fonctionnalité et je lui ai répondu que je préfère utiliser un segment pour filtrer en masse plutôt que de le faire manuellement à chaque fois vers la liste d’exclusion. J’ai bien fait 😉
    Merci Olivier.

  2. Bonjour, Merci pour le tuto. Un peu difficile à première vue mais il faut sauter le pas. Sur notre site, on a cinq à sept spammeurs par mois. Des fois ce sont les mêmes têtes, des fois ce sont des nouveaux. Je procéderai au nettoyage la semaine prochaine et de bloquer au fur et à mesure. Encore merci de votre aide.

  3. salut et merci pour cet excellent article, ma question est : quelle syntax faut il utiliser pour faire un filtre qui cache tout les référents en « .xyz »? sera-t-elle efficace? Merci pour cette précision.

  4. Depuis quelques jours, de nouveaux sites comme « lifehacĸer.com » et des domaines qui se terminent en .xyz envoient pas mal de spam dans l’analytics et faussent les données. En voici une liste que vous pouvez ajouter dans votre filtre pour les faire disparaitre :
    thenextweb.com
    lifehacĸer.com
    boltalko.xyz
    brateg.xyz
    buketeg.xyz
    budilneg.xyz
    biteg.xyz
    bukleteg.xyz
    bezlimitko.xyz
    arendovalka.xyz
    begalka.xyz
    abcdefh.xyz
    alfabot.xyz
    advokateg.xyz

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *