Vous venez de constater que votre site à disparu des résultats de recherche sur des requêtes importantes pour votre business ? Peut-être que votre site vient d’être sanctionné par l’algorithme Google Panda, le filtre dédié au contenu, et qu’il vous à donc infligé une pénalité de référencement.
Qu’est-ce que Google Panda ?
Panda est le nom de l’un des filtres de recherche mis en place par Google pour lutter contre les sites de faible qualité. En effet, le moteur de recherche souhaite présenter à ses internautes des contenus intéressants. La pénalité Panda lui permet donc de débarrasser ses résultats de recherche de tous les sites qui sont considérés comme des spammeurs, c’est-à-dire de tous ceux qui polluent ses SERP.
La toute première version de Panda a été lancée en février 2011. A partir de mars 2013, les mises à jour de Panda sont directement intégrées dans l’algorithme de Google. Depuis, le filtre reçoit une update régulièrement. Lors d’une mise à jour, les sites précédemment impactés peuvent sortir de la pénalité Panda s’ils ont corrigé leurs erreurs, tandis que de nouveaux sites peuvent être pris dans les mailles du filet…
On peut classer les pénalités Google Panda en 2 grandes catégories :
- La pénalité manuelle, qui est associée à un message d’avertissement dans la Google Search Console (anciennement Webmaster Tools)
- La pénalité algorithmique, qui est appliquée automatiquement sans qu’aucun message ne vienne vous en informer.
Qui est impacté par la pénalité Panda ?
Le filtre dédié au contenu des pages a plusieurs cibles dans son viseur :
- Les sites avec un contenu pauvre, sans réelle valeur ajoutée. Par exemple, s’il y a très peu de contenu textuel sur vos pages, ou que celles-ci sont suroptimisées (répétition du mot clé de manière excessive sur la page)
- Les sites avec des contenus dupliqués (plagiat). Lorsqu’une partie de vos textes est constituée de plagiats d’autres sources, que vous avez copier-coller des textes, des descriptifs de produits… alors vous êtes en présence de duplicate content ce qui est sanctionné par le filtre. Cela peut également être le cas si quelqu’un d’autre vous à volé votre contenu.
- Les fermes de contenus, c’est-à-dire des sites qui proposent des pages sur des requêtes populaires, constituées à partir de textes volés et réécrits automatiquement. Leur but est de se positionner sur un grand nombre de requêtes pour générer des revenus publicitaires. Ces textes rédigés automatiquement par un programme sont bien souvent incompréhensibles pour les internautes.
D’autres facteurs peuvent également amener l’algorithme à prononcer une sanction. Il s’agit notamment du cloacking, c’est-à-dire le fait de proposer un contenu différent à l’internaute et au robot d’indexation, des liens et des textes cachés (écrire en blanc sur fond blanc par exemple), d’adapter le contenu présenté à l’internaute en fonction de la localisation de son adresse IP (IP delivery), d’afficher une quantité abusive de publicité, d’avoir mis en place une arborescence trop profonde du site…
En résumé, les sites qui ont été fortement visés par le filtre sont des comparateurs de prix (souvent frauduleux), des annuaires (de faible qualité), des sites de coupons de réduction et d’affiliation, certains forums de discussion, des agrégateurs d’avis de consommateurs, des portails d’actualité…
On reconnait qu’un site est pénalisé par Panda lorsque l’on observe certains symptômes spécifiques :
- Si vous constatez via la Search Console que le crawler (le robot d’indexation de Google) ne vient plus sur votre site ou alors que ses visites sont très espacées dans le temps.
- Si vous constatez via la commande site: que certaines pages ne sont pas ou plus indexées
- Si vous constatez que vous avez perdu des positions sur vos mots clés ou que vous avez été déclassé sur certains mots clés.
La levée de pénalité Google Panda
Afin de sortir de la pénalité Panda, vous allez devoir procéder étape par étape en vous posant les bonnes questions :
1) Avez-vous des pages avec un faible contenu (moins de 50 mots par exemple) ? Si la réponse est oui, alors il va falloir enrichir ces pages. Je vous conseille de rédiger un texte d’au moins 250 à 300 mots afin de compléter le contenu existant. Vous pouvez également analyser votre ratio texte/code pour déterminer si vos pages sont assez riches en contenu textuel.
2) Avez-vous copié-collé des textes trouvés sur internet, comme par exemple sur Wikipédia, chez vos concurrents, sur la notice du fabricant du produit que vous vendez… Là encore, si la réponse est oui, alors vous allez devoir supprimer tous les textes dupliqués, ou tout du moins les réécrire intégralement en les reformulant à la main (n’utilisez pas d’outils de réécriture automatique).
Pour vous aider à repérer le contenu dupliqué, il existe des outils dédiés tels que Siteliner. Il vous suffit d’indiquer votre adresse URL dans la barre de recherche et cet outil va vous ressortir la liste des pages sur lesquels on retrouve le plus de contenu dupliqué.
Une autre astuce pour vérifier si un texte a été copié ailleurs sur internet consiste à sélectionner un petit bout du texte en question (copié une à deux phrases maximum) et à faire une recherche sur Google en plaçant des guillemets avant et après la phrase recherchée. Votre requête prendra donc la forme suivante : «le morceau de texte à vérifier». En fonction des résultats, vous allez pouvoir repérer les sites sur lesquels on retrouve le même extrait de texte que le vôtre. S’il n’y a pas de résultats hormis ceux de votre site, alors vous pouvez considérer que votre texte est bien unique.
3) Avez-vous suroptimisé vos pages pour le référencement ? Autrement dit, y a-t-il du bourrage de mots clés dans vos textes ? Si vos mots clés présentent un taux d’occurrence supérieur à 5% du contenu global de la page, alors il va falloir diminuer l’utilisation du mot clé en question. Pour cela, vous pouvez notamment le remplacer par des synonymes ou simplement supprimer des occurrences facultatives.
Pour vous aider à trouver la bonne densité de mots clés, vous pouvez vous aider de l’outil alyse.info
Lorsque vous analyserez une page avec cet outil, votre objectif sera alors d’obtenir un taux de densité pondérée le plus élevé possible avec un nombre d’occurrences du mot clé le plus faible possible.
4) Vos textes sont-ils écrits dans un français compréhensible, avec une syntaxe correcte (sujet, verbe, complément) ? Si ce n’est pas le cas, il faudra les retravailler en privilégiant les phrases courtes facilement compréhensibles. Faites attention aux fautes d’orthographe et au langage SMS qui est à proscrire impérativement.
5) Votre contenu important est-il facilement accessible en 3 clics maximum ? Si vous avez besoin d’effectuer de nombreux clics depuis votre page d’accueil pour trouver l’information ou le produit qui vous intéresse, alors il faudra revoir l’arborescence du site de façon à simplifier la navigation.
6) Avez-vous abusé de la publicité ? Bannières et fenêtres pop-up en trop grand nombre constituent un mauvais signal pour les moteurs de recherche et agacent les internautes. Faites donc le ménage dans vos emplacements publicitaires et ne conservez que le strict minimum (publicité non intrusive).
7) Pensez enfin à désindexer, à l’aide de votre fichier robots.txt, les pages inutiles comme l’accès au back-office ou le panier, qui vous font perdre des ressources de crawl inutilement.
8) Google propose également une liste de questions à vous poser pour savoir comment mettre en place un site web de qualité, et dont vous pouvez vous inspirer pour effectuer les corrections nécessaires à la sortie de pénalité Panda.
Une fois que toutes ces mesures visant à promouvoir la qualité seront mises en place, alors la pénalité Panda pourra être levée (lors de la prochaine mise à jour du filtre).
Les dates de mises à jour de Google Panda
Connaître les dates des mises à jour du filtre Panda vous permet de les comparer avec les données issues de votre Analytics. Si vous remarquez une importante chute de votre trafic à la même période que celle du déploiement de l’une des updates suivantes, alors vous disposez d’un indice important qui vient confirmer que cette baisse est due à l’impact de Panda.
Les dates les plus importantes :
⇒ 24 février 2011 : lancement aux Etats-Unis avec 11,8% des requêtes environ qui sont impactées
⇒ 11 avril 2011 : déploiement sur toutes les versions anglophones de Google
⇒ 12 aout 2011 : déploiement en France et dans les pays non anglophones
⇒ 27 septembre 2012 : grosse mise à jour du filtre
⇒ 15 mars 2013 : Panda est directement intégré dans l’algorithme de Google
⇒ 26 mai 2013 : cette mise à jour incorpore de nouveaux signaux, censés permettre une analyse plus fine.
⇒ 22 septembre 2014 : Panda 4.1. Cette update était censée aider les petits sites proposant une vraie plus value aux internautes face aux géants du web.
⇒ 18 juillet 2015 : Panda 4.2. Il s’agit de la dernière version actuellement ; celle-ci sera mise en ligne progressivement sur plusieurs semaines.
Très bon article, clair et efficace ! cela peut assez vite tourner à l’obsession d’où cette piqûre de rappel pour ne point s’éloigner des fondamentaux…