Vous cherchez quelque chose ?

Six erreurs à ne pas faire avec la balise rel=canonical


Les balises rel=canonical constituent un outil indispensable pour éviter le duplicate content de pages identiques sur un même site. Toutefois, il faut bien savoir utiliser cet attribut pour arriver à cet objectif.

6 erreurs canonicalEn s'appuyant sur ses missions d'audits techniques SEO, de résolution de problèmes liés à Penguin et aux travaux sur Panda, Glenn Gabe, un expert SEO, a analysé plusieurs millions de pages web. Sur la base de ces analyses, il a décelé un certain nombre de problèmes techniques assez sérieux, ayant fortement pénalisé les performances SEO des sites en question. Entre les problèmes de métadonnées, les soucis d'affichage ou de contenus sur les mobiles, les contenus dupliqués, les redirections intempestives et les contenus pauvres, les défaillances décelées par cet analyste sont multiples et très variées. Pis, une grande partie de ces problèmes techniques n'apparaissent pas directement en surface et restent cantonnés à l'échelle des codes. Ils demeurent ainsi non identifiés pendant un long moment, et logiquement, non résolus, ce qui influe significativement sur les performances SEO du site. Seul un audit SEO approfondi permet de révéler ces erreurs techniques au grand jour.

Dans une vidéo publiée la semaine dernière, John Mueller, Trend Analyst chez Google, a fait un commentaire montrant toute l'importance d'une bonne balise d'URL canonique sur les pages web. Selon lui, Google traite les balises rel=canonical en seconde ou troisième position dans son processus d'exploration. Le traitement de ces attributs ne constitue pas pour autant une étape de l'exploration proprement dite : il est effectué tout au long de l'exploration et de l'indexation des pages web. Cela explique l'indexation de certaines pages avec des URL canoniques d'autres pages, également invitées. Cette approche de Google ne représente pas un problème en soi, mais fournit des indications précises sur la façon dont le moteur de recherche considère les balises rel=canonical.

Suite à cette publication, l'expert a publié le commentaire du remplaçant de Matt Cutts sur son compte Twitter et a obtenu en retour un taux d'engagement conséquent. Il en déduit que les problèmes liés aux attributs rel=canonical continuent de semer la confusion auprès des webmasters. Certes, Google a détaillé maintes et maintes fois les problèmes les plus communs soulevés par les balises d'URL canoniques. Toutefois, ces publications ne traitent pas de toutes les questions auxquelles les webmasters sont confrontées avec ces balises. Ainsi, sur la base des 11 milles pages explorées et étudiées en 2014, l'analyste Glenn Gabe a jugé bon de (re)lister les défis soulevés par les attributs rel=canonical et d'indiquer la façon de les résoudre. Il espère ainsi convaincre ses lecteurs de changer rapidement leur façon d'utiliser les balises d'URL canoniques et d'optimiser les performances SEO de leur site.

En analysant plusieurs pages de différents sites, Glenn Gabe découvre que plusieurs webmasters insèrent la balise rel=canonical sur l'URL de plusieurs sections de contenus et les liens à une seule page. La section canonisée contient souvent quelques dizaines d'URL et le site utilise la balise rel=canonical pour les pointer vers une autre page. Ce procédé a toutefois un inconvénient : les sections ainsi canonisées ont très peu de chances d'être bien positionnées dans les résultats de recherche. Les robots d'indexation de Google attribuent en effet toutes les propriétés d'indexation sur la page utilisée dans la balise rel=canonical, autrement dit celle affichée sur le href.

Cet attribut n'est pas conçu pour pointer plusieurs pages aux contenus uniques vers une seule page – dans le but de renforcer sa position dans les SERPs -, mais sert plutôt à signaler la présence de contenus sur plusieurs URL différentes. L'implémentation d'attributs rel=canonical sur plusieurs pages apparaît pourtant comme une démarche logique plusieurs webmasters, souhaitant ainsi booster le niveau d'indexation de l'URL href, censé pointer vers la page la plus importante du site, sur les moteurs de recherche. Cette pratique provoque pourtant l'effet inverse : en canonisant les URLs de plusieurs pages au contenu unique sur une seule URL, les contenus ainsi liés n'ont plus aucune possibilité de se faire remarquer sur les moteurs de recherche. Sur des sites contenant plusieurs pages, l'effet sur le positionnement web pourrait être dévastateur.

La leçon à retenir est la suivante : si votre site contient plusieurs pages avec des informations uniques et intéressantes, n'intégrez aucune balise rel=canonical les liant à une ou plusieurs autres pages. Les pages ainsi « épargnées » seront ainsi indexées et visibles dans les résultats de recherches sur des mots clés liés à leur contenu. Et en prenant en compte le concept de la longue traîne, l'indexation de pages supplémentaires constitue une source de visiteurs non négligeables pour votre site web.

Lors de l'utilisation d'une balise d'URL canonique, mieux vaut éviter à tout prix les connexions de plusieurs attributs « href » canonisés. Sur ce point, l'erreur apparaît souvent sous la forme suivante : le webmaster canonise la page 2.htm à la page 1.htm, ce dernier même est ensuite canonisé à la page3.htm. Une telle interconnexion envoie des signaux étranges aux robots d'indexation des moteurs de recherche.

Dans certains cas, la page3.htm n'existe même pas et entraîne une rédirection 301 ou 302. Devant tant de confusion, les robots d'indexation des moteurs de recherche traitent les signaux comme ils sont reçus, c'est-à-dire bizarrement. Cela entraîne des soucis de positionnement plus ou moins visibles dans les SERPs.

Pour y remédier, la seule solution consiste à bien préciser l'URL canonique pour toutes les pages auxquelles elle est liée.

Cette situation ne semble pas constituer un véritable problème, mais peut toutefois causer des soucis dans le référencement des pages d'un site. Lors d'une récente mission, Glenn Gabe s'est penchée sur un site qui utilise des URL non-canoniques sur plusieurs milliers de pages. L'erreur apparaît alors lorsqu'une page est référencée sous sa version non-canonique dans l'attribut rel=canonical. Seulement, cette version non-canonique redirige automatiquement l'exploration et l'indexation vers la version originale, autrement dit la version canonique. La seule présence de la redirection ralentit de façon significative l'indexation de la page. A l'échelle d'un site, qui contient plusieurs pages, les répercussions de cette erreur sur l'indexation et le positionnement dans les moteurs de recherche ne peuvent être que négatives. L'idéal serait alors de pointer la balise rel=canonical vers l'URL originale de la page, plutôt que d'utiliser une version non-canonique qui ralentira le processus d'exploration et d'indexation.

Certains sites n'implémentent simplement aucune balise d'URL canonique sur les pages aux contenus plus ou moins similaires. Sur un site ne contenant qu'un nombre de pages limités, cette omission ne constitue pas en soi un grave problème. Les soucis apparaissent plutôt sur les sites plus complexes et plus importants.

Par exemple, dans une analyse récente d'un site utilisant massivement des paramètres de suivi de campagne, aussi bien pour les promotions internes que pour les campagnes externes, Glenn Gabe remarque la présence plusieurs URLs avec des paramètres de chaîne de requête explorées et indexées par Google. Plusieurs de ces liens ont des versions non-canoniques également explorées et indexées. Cela revient à ne pas implémenter de balise rel=canonical sur les pages en question. En procédant ainsi, le webmaster court le risque de diluer la force des URLs et de leurs variations liées par des paramètres de chaîne de requête.

Sachant que l'intégration d'une balise URL canonique constitue un signal envoyé aux moteurs de recherches, leur signifiant de lier des versions dupliquées ou similaires à l'originale, soit à l'URL canonique, l'omission de l'attribut pénalise fortement le référencement de l'URL originale, mais aussi de ces variantes, surtout celles reliées à des adresse URL extérieures. L'impact d'une telle omission est encore plus conséquent sur les sites dotés de plusieurs milliers de pages. Nous vous conseillons de mettre en place les balises rel=canonical de façon automatique, soit à travers les codes de votre propre serveur, soit en utilisant des plugins.

Les supports mobiles font l'objet d'une attention toute particulière du web ces dernières années, avec la montée en puissance des smartphones et autres tablettes. Plusieurs sites web commencent désormais à proposer une version mobile de leurs pages, afin de toucher un maximum de lecteurs sur les supports mobiles comme sur les terminaux fixes. Le problème dans ce cas réside dans la non implémentation de balises URL canoniques sur des pages présentes à la fois sur la version mobile et sur la version web du site.

Pour contourner ce problème, Google recommande l'intégration d'un attribut rel=alternate sur les URLs fixes pointant vers leurs versions mobiles, et à l'inverse, d'utiliser la balise rel=canonical sur les URLs mobiles renvoyant vers les URLs fixes. En agissant ainsi, vous indiquez à Google qu'il s'agit en réalité des mêmes pages, qui doivent être traitées de la même manière. L'absence de ces indications entraîne la présence de plusieurs pages dupliquées, du point de vue des moteurs de recherche, qui seront alors explorées et indexées séparément. A grande échelle, ce mode de traitement pénalise énormément le positionnement de la version mobile du site sur les moteurs de recherche.

Contrairement à ce que disent certains analystes, séparer les URLs mobiles d'un site de celles de la version pour terminaux fixes fonctionne très bien, en terme de référencement, pour tous les sites. Les résultats semblent même plus satisfaisants, comparés aux performances SEO des sites adaptative ou responsive design. Glenn Gabe a relevé à travers ses différentes missions plusieurs versions mobiles de sites qui sont bien placées dans les résultats de recherche sur mobiles comme sur les terminaux fixes. De telles performances restent néanmoins impossibles, si les balises rel=alternate et rel=canonical ne sont pas bien placées sur les deux versions des sites.

Cette erreur, pourtant grossière, revient assez souvent sur les sites web et reste généralement incomprise ou inconnue avant que les pages commencent à chuter dans l'index et que le site perd beaucoup de places dans les SERPs. Le pointage d'une balise canonique vers une page non indexé ou non existant fera perdre à coup sûr aux pages canonisées plusieurs places dans les résultats de recherche. La logique de ce raisonnement se veut simple : pointer une balise rel=canonical vers un 404 ou une URL non indexée – utilisant un attribut « noindex » ou des métarobots – revient à signifier à Google que le contenu original est en effet une page non existante ou qui ne peut être affichée dans les résultats de recherche.

Les conséquences d'une telle « farce » peuvent être conséquentes, si l'on se réfère au cas de cette compagnie qui a vu le trafic et le positionnement de son site dégringoler rapidement. Après une analyse rapide, la raison du déclassement est la présence de plusieurs pages utilisant des balises URL canoniques renvoyant vers des pages 404 ou non indexées. Le site contient pourtant plus de 10 milles pages indexées, fournissant ainsi à Google des informations erronées. Après les modifications effectuées par l'équipe de développement, le site regagne son positionnement normal en deux semaines seulement.

Les 6 erreurs mentionnées dans ce billet ne représentent qu'une infime partie des erreurs souvent constatées dans l'utilisation des balises rel=canonical. Leurs impacts sur le positionnement d'un site et leur notoriété auprès des moteurs de recherches sont pourtant non négligeable. La meilleure façon de ne pas tomber dans ces pièges consiste alors à réaliser un audit technique SEO des sites, avant leur mise en ligne et de déceler et réparer ainsi en avance ces dysfonctionnements. Dans tous les cas, les principes à respecter dans l'usage des URLs canoniques restent inchangés : veillez à rendre les attributs rel=canonical simples et lisibles, envoyez des signaux clairs aux moteurs de recherche et soyez cohérents sur votre site web.


Si vous ne trouvez pas la chronique correspondante à votre recherche, c'est peut-être l'occasion de la rédiger ;-)

Proposer ma chronique

Aimez-vous cet article ?

Nos réseaux préférés

Ajouter un commentaire