Mes Mots SEO – Ecrit n°4 : Attention à la version imprimable

La version imprimable est souvent une fonctionnalité présente au sein d’un site. Elle permet à tout internaute d’imprimer un contenu afin de le lire sur papier et de le conserver chez lui physiquement.

Généralement, lorsque je fais un audit, je recommande à toute personne de désindexer les versions imprimables, versions PDF ou tout autre type d’affichage ou de document pouvant faire doublon avec un contenu web classique. Les moteurs doivent en effet se concentrer sur une version en particulier plutôt que de se disperser sur d’autres pages voulant dire la même chose, mais n’étant pas la référence (page canonique).

Depuis un certain temps, je remarque quelques changements assez bizarre et qui pose pas mal de problèmes sur des projets niveau indexation, les versions imprimables s’indexent sur des sites de mes clients alors que ça fait des années que ce n’est pas le cas. Je m’explique.

J’ai trois clients qui sont à la fois sur WordPress et sur PhpBB. Ça fait des années, plus de dix ans pour un en particulier, que ces versions imprimables sont disponibles avec la même fonctionnalité, la même forme, la même adresse, les même contenus. Il n’a jamais eu de problèmes avec cela, et depuis la quality update environ (pour ces trois cas du moins), Google décide d’indexer et de créer 90% voire 100% de résultats en plus pour ce site, tous doublons d’une page. Ainsi, de 10000, je passe à 20000.

On a pas compris tout de suite d’où venait le problème, surtout pour le site en HTML. Il faut dire que comme on travaille les contenus, qu’on en ajoute/retire, faisons d’autres modifications liées à l’indexation, assez difficile de s’y retrouver lorsqu’à l’audit il n’y avait pas ce genre de résultats imprimables qui ressortaient, surtout qu’ils étaient pour certains en noindex !

En tout cas, niveau conséquence, plus les pages imprimables s’indexaient, plus le référencement et le trafic naturel baissait. Rien d’étonnant d’ailleurs. Aujourd’hui, j’ai fait désindexer ces pages et sur les deux premiers cas qui sont des WordPress, ça m’a tout remonté. Ça ne m’étonne pas non plus.

Ainsi, ce petit billet pour vous faire part d’une constatation assez nuancée. On savait que la version imprimable pouvait causer des problèmes (entendons-nous bien), mais pourquoi Google n’a pas fait la différence plus que cela cette fois-ci et a décidé d’indexer ces pages 10 ans après, il n’y a vraiment pas de raison que ce soit liés aux modifications que nous avons faites. Dans la search console, les paramètres sont pris en compte comme au premier jour, les sites n’ont pas bougé plus que cela. Pourquoi aujourd’hui, c’est surtout ça…

Bref, histoire de valider le truc, est-ce que des personnes ont eu des problèmes de ce genre ces derniers temps ? Hausse du volume de pages indexées soudaine après X temps sans soucis puis déclassement ?