URL canonique (canonical URL) : toutes les explications
L’URL canonique est une notion inventée par Google, Microsoft et Yahoo pour réduire les problèmes d’indexation liés aux contenus dupliqués. Une bonne gestion des URL canoniques (canonical URL) peut s’avérer essentielle en termes de référencement naturel, notamment si votre site web a beaucoup de contenu dupliqué. Cette page vous explique tout ce qu’il faut savoir sur les pages canoniques.
Qu’est-ce qu’une URL canonique ?
Le terme URL canonique est un terme essentiel en matière de référencement naturel (SEO). Commençons par expliquer clairement qu’est-ce qu’une page canonique, et quelle est son utilité.
URL canonique : définition
L’URL canonique, aussi appelée lien canonique ou en anglais « canonical url », est un terme qui peut désigner un ou plusieurs liens d’un site internet.
Si un site web dispose de plusieurs pages similaires, l’URL canonique est la page considérée comme principale par Google et par les autres moteurs de recherche.
L’URL canonique est notamment utilisée quand plusieurs liens différents mènent à la même page (par exemple le lien « http://www.url.com » et le lien « http://url.com »).
Imaginons qu’un site web dispose de dix pages pratiquement identiques (par exemple dix fiches produits qui utilisent strictement le même texte et les mêmes images). Les moteurs de recherche auront tendance à n’en considérer qu’une seule dans leurs résultats, à savoir l’URL canonique.
La notion de canonical URL permet aux moteurs de recherche de traiter le problème de contenus dupliqués (grand nombre de pages identiques les unes aux autres) en prenant uniquement en compte une page principale.
Dans la majeure partie des cas, seul le lien canonique apparaîtra dans les SERP Google (les résultats de recherche), d’où son importance du point de vue SEO.
Rôle et impact de l’URL canonique
Le choix d’une URL canonique permet aux moteurs de recherche de mieux traiter la problématique du contenu dupliqué. Si un site internet dispose de plusieurs pages identiques ou très proches, Google peut automatiquement définir une URL canonique, qui sera la seule page indexée.
On notera néanmoins qu’un webmaster peut également indiquer aux moteurs de recherche quelle est l’URL canonique d’un groupe de pages (grâce à l’utilisation de l’attribut link rel=« canonical »).
Définir vous-même vos liens canoniques vous permet de mieux contrôler quelles sont les pages indexées de votre site web, et donc de vous assurer de mettre en avant les pages qui sont pertinentes.
N’oublions pas que les pages dupliquées non canoniques ne seront généralement pas indexées, et qu’il y a de forts risques pour que les robots des moteurs de recherche les parcourent moins régulièrement.
Comment indiquer une URL canonique ?
Si vous souhaitez indiquer une URL canonique sur votre site web, vous allez devoir utiliser la balise canonical, à savoir une balise <link> avec l’attribut rel=“canonical”, sur l’ensemble des pages en double.
Cet attribut se situe dans la balise head de vos pages dupliquées, et prendra la forme suivante :
<head>
<!– Autres balises de l’en-tête ici –><!– Balise canonique –>
<link rel=“canonical” href=“https://www.url-de-la-page-canonique.fr” />
</head>
Bien évidemment, le terme « https://www.url-de-la-page-canonique.fr » doit être remplacé par la véritable URL canonique.
Votre balise canonical doit mentionner l’URL de la page canonique, et être présente sur toutes les pages dupliquées. Cet attribut permettra aux moteurs de recherche de mieux comprendre votre site internet, et augmente vos chances de voir votre page canonique indexée (plutôt que d’autres pages).
On notera que la sélection d’une URL canonique sur WordPress peut être facilitée par l’utilisation d’extensions SEO, comme Yoast SEO ou Rank Maths.
Attention : Google peut choisir une autre URL canonique que celle que vous lui soumettez, si l’algorithme considère qu’elle est plus pertinente. Les critères de choix de Google sont nombreux (protocole HTTPS, contenu de la page, redirections, maillage interne, etc.).
Dans quels cas utiliser une canonical URL ?
Le lien canonique est un élément qui est avant tout utile pour certaines typologies de pages ou de sites web.
De manière générale, l’attribut canonical a intérêt à être utilisé dans les cas suivants :
- URL différentes vers une même page : si plusieurs URL mènent à la même page (par exemple « http://www.url.com/page » et « http://url.com/page » ou « http://www.url.com/page » et « https://www.url.com/page »).
- Plusieurs pages dupliquées : si plusieurs pages ont un contenu similaire (par exemple plusieurs fiches produits d’une même typologie de produits, ou une déclinaison automatique de pages catégories).
- Des fonctionnalités de tri : si une même page peut avoir différentes URL liées aux fonctionnalités du site (par exemple un champ de tri ou de filtrage d’une page catégorie).
- URL avec pagination : si une même page web est paginée, comme ce peut être le cas avec des listes d’articles de blogs (par exemple « www.url.com/categorie/page1 » et « www.url.com/categorie/page2 »).
Très souvent, l’URL canonique est incontournable pour les gros sites web (et notamment les sites e-commerce), qui sont plus exposés à des risques de contenus dupliqués. Dans le référencement d’un site vitrine ou d’un site simple, l’utilisation de pages canoniques ne devrait pas être nécessaire.
Canonical URL et contenu dupliqué
Impossible d’évoquer les liens canoniques sans faire référence au contenu dupliqué en SEO.
Dans les faits, l’utilisation d’URL canoniques est une bonne pratique, qui permet de limiter l’impact négatif du contenu dupliqué de votre site internet. Ceci dit, et avant même d’utiliser des liens canoniques, il paraît pertinent de limiter tout le contenu dupliqué qui ne serait pas absolument nécessaire sur votre site web.
En effet, un trop grand nombre de pages dupliquées peut ralentir inutilement le travail des robots d’indexation, et pénaliser le référencement de votre site web. Il est donc important de n’utiliser des liens canoniques que lorsqu’ils sont absolument nécessaires.
Comment limiter les URL canoniques ?
Comme vu plus haut, les URL canoniques sont souvent liées à des éléments techniques de votre site (par exemple des fonctionnalités de tri sur une même URL).
Avant même de chercher à mettre en place des URL canoniques, il est impératif de limiter tout contenu dupliqué sur votre site web.
Il existe différentes manières pour limiter la nécessité de liens canoniques :
- Utilisez des redirections 301 : les redirections 301 sont des redirections permanentes. Elles peuvent être utiles pour limiter le contenu dupliqué. Plutôt que de conserver deux versions d’une même page, privilégiez une redirection 301 de l’URL secondaire vers l’URL canonique, et supprimez la première URL.
- Faites en sorte que chaque page ne soit accessible que par une URL : une bonne conception technique du site permet d’éviter la création de plusieurs URL pour chaque page. Il est par exemple conseillé de mettre en place une redirection HTTPS systématique, pour éviter que chaque page soit accessible en HTTP et en HTTPS.
- Limitez la duplication de contenu : il n’est pas pertinent d’avoir plusieurs pages identiques sur un même site web. Si cela ne nuit pas à l’expérience client, supprimez toutes les pages en double ou modifiez le contenu des pages doubles pour que chaque page présente un contenu unique et pertinent, qui vise idéalement un mot clé principal et unique. Consultez notre dossier mots clés et SEO pour en savoir plus.
- Utilisez des URL simples : tant se faire que peut, évitez les paramètres d’URL ou les formats d’URL compliqués. Utiliser des liens simples et lisibles améliore l’expérience utilisateur et limite le risque de pages dupliquées.
- Utilisez un sitemap : pensez à mettre en place un fichier sitemap.xml qui mentionne uniquement vos URL canoniques. Cela va renforcer vos pages principales et indiquer clairement aux moteurs de recherche quelles sont les pages à prendre en compte.
- Utilisez le fichier robots.txt : une autre manière de simplifier le travail des moteurs de recherche est d’utiliser un fichier robots.txt, qui indique aux moteurs de recherche quelles sont les pages à parcourir ou à ne pas parcourir. Ce fichier peut notamment empêcher l’indexation d’URL non pertinentes. La balise noindex peut également jouer le même rôle (elle doit alors être utilisée sur les pages en double, pour indiquer aux moteurs de ne pas les indexer).
- Surveillez le contenu dupliqué : examinez régulièrement la Google Search Console pour vérifier si des pages sont dupliquées sur votre site web, et adoptez des solutions adaptées pour réduire tout contenu dupliqué.
Encore une fois, rappelons que l’existence d’URL canoniques est une bonne pratique sur des pages pertinentes (en particulier sur des sites e-commerce ou sur de très gros sites).
En revanche, si votre site a une majorité de contenus dupliqués, cela peut indiquer qu’il est techniquement mal conçu, et pourrait représenter un risque en matière de référencement naturel.
Page en double sans URL canonique sélectionnée par l’utilisateur
Si vous utilisez la Google Search Console (ce qui est vivement conseillé pour suivre l’indexation de votre site web), vous pourriez découvrir l’erreur d’indexation « Page en double sans URL canonique sélectionnée par l’utilisateur ».
Au même titre que l’alerte « explorée, actuellement non indexée », ce message vous indique que Google a choisi de ne pas indexer votre page. Ici, le refus d’indexation est tout simplement lié au fait qu’une page identique est déjà indexée. Pour résoudre ce problème, différents choix s’offrent à vous :
- Vous pouvez utiliser une balise canonique sur la page, pour indiquer quelle est l’URL canonique de cette page doublon.
- Vous pouvez modifier le contenu de la page pour le rendre unique, et demander une nouvelle indexation.
- Vous pouvez créer une redirection 301 vers la page canonique, et supprimer cette URL doublon (si cela n’a aucun impact sur l’expérience utilisateur).
Une fois de plus, un tel problème n’est pas gravissime sur une simple page, mais peut devenir un risque SEO si un grand nombre de pages souffre du même problème.
Ce guide vous a donné une vision plus globale de l’URL canonique. Il ne vous reste plus qu’à vérifier si votre site héberge encore du contenu dupliqué !