Ce qu'est la balise canonical
La balise canonical est un élément HTML placé dans le <head> d'une page. Elle indique aux moteurs de recherche quelle URL est la version "officielle" d'un contenu donné. En termes techniques, on appelle ça signaler l'URL canonique.
Sa syntaxe est simple :
<link rel="canonical" href="https://monsite.com/ma-page/" />
Quand Google rencontre cette balise sur une page, il comprend que c'est l'URL indiquée qui doit être indexée et positionnée. Les éventuelles autres versions (avec paramètres, en HTTP, sans slash final…) sont ignorées pour le classement.
Canonical vs redirection 301 : quelle différence ?
La redirection 301 renvoie l'utilisateur et les robots vers une nouvelle URL. La balise canonical laisse les pages accessibles mais désigne laquelle doit compter en SEO. On utilise le canonical quand on veut garder les pages actives (pour l'expérience utilisateur ou les campagnes publicitaires) sans diluer l'autorité entre plusieurs versions.
Quand utiliser la balise canonical
La balise canonical n'est pas réservée aux cas extrêmes. Voici les situations concrètes où elle est utile, voire indispensable.
| Situation | Problème sans canonical | Solution |
|---|---|---|
| Paramètres d'URL (tracking, filtres, tri) | Google voit des dizaines de variantes de la même page | Canonical vers l'URL propre sans paramètre |
| Contenu syndicué (republié sur d'autres sites) | Le contenu original peut être déclassé au profit d'une copie | Le site qui republie pointe son canonical vers l'original |
| Versions HTTP et HTTPS coexistantes | Autorité divisée entre deux protocoles | Canonical vers la version HTTPS + redirection 301 |
| Pagination (/page/2/, /page/3/…) | Contenu partiel répété, signaux dilués | Canonical vers la page principale (si les sous-pages n'ont pas de valeur propre) |
| Fiches produit avec variantes (taille, couleur) | Plusieurs URLs quasi-identiques | Canonical vers la fiche principale |
Les erreurs courantes avec le canonical
La balise canonical est facile à mal implémenter. Ces erreurs reviennent régulièrement dans mes audits.
-
Le canonical pointe vers la mauvaise URL
Sur certains CMS, une mauvaise configuration génère des canonicals qui pointent vers la page d'accueil ou vers elles-mêmes mais avec une URL incorrecte. Résultat : Google ignore le signal ou le considère comme incohérent.
-
Canonical en conflit avec une redirection
Si la page A a un canonical vers B, mais que B redirige vers C, Google ne sait pas quoi indexer. Les signaux doivent être cohérents et alignés.
-
Chaîne de canonicals
A pointe vers B qui pointe vers C. Google ne suit généralement pas plus d'un niveau. Le canonical doit pointer directement vers la version finale.
-
Canonical absent sur les pages à paramètres
Un site e-commerce sans canonical sur ses pages filtrées peut générer des centaines d'URLs dupliquées que Google explore inutilement, consommant le budget de crawl.
Le canonical externe : republier sans risque
Le canonical peut aussi pointer vers un autre domaine. C'est la clé pour republier du contenu sur des plateformes tierces (Medium, LinkedIn Articles, presse spécialisée) sans risquer de pénalité pour duplicate content.
Si un magazine en ligne publie l'un de mes articles, il peut insérer dans son code un canonical qui pointe vers l'URL originale sur mon site. Résultat : il garde la page accessible pour ses lecteurs, mais Google sait que la version de référence est la mienne.
Le canonical est un signal, pas une directive. Google peut choisir de l'ignorer s'il juge que l'URL indiquée n'est pas la meilleure version. En pratique, il suit le canonical dans la très grande majorité des cas, mais des incohérences dans la structure du site peuvent le conduire à passer outre.
Canonical vs noindex : lequel choisir ?
Canonical et noindex sont deux façons différentes de dire à Google de ne pas indexer une version d'une page. Choisir la mauvaise solution crée des problèmes.
| Situation | Canonical | Noindex |
|---|---|---|
| Page de filtre e-commerce (/chaussures/?couleur=rouge) | Préféré : la page reste accessible, le canonical consolide l'autorité vers la page principale | Possible, mais la page n'est plus accessible via les filtres si mal géré |
| Page de confirmation de commande | Non adapté : la page n'a pas de version équivalente à désigner | Préféré : la page n'a aucune valeur SEO, on l'exclut complètement |
| Contenu republié sur un autre site | Préféré sur le site tiers : pointe vers l'original pour consolider l'autorité | Non adapté : prive la page tierce de valeur sans raison |
| Page de pagination (/blog/page/3/) | Si les pages de pagination n'ont pas de valeur propre : canonical vers la page principale | Si on veut les exclure totalement de l'index |
La règle de décision : si la page a de la valeur pour l'utilisateur et doit rester accessible, mais ne doit pas être indexée, utilisez un canonical vers la version de référence. Si la page n'a aucune valeur (confirmation de commande, page de connexion), utilisez noindex.
Comment vérifier et auditer les balises canonicals
Les erreurs de canonical passent souvent inaperçues parce qu'elles ne génèrent pas d'erreur visible. Il faut les chercher activement.
- Screaming Frog : dans l'onglet "Canonicals", il liste toutes les pages avec leur balise canonical et signale les canonicals non canoniques (qui pointent vers des URLs qui elles-mêmes ont un canonical différent), les canonicals vers des pages redirigées, et les pages sans canonical explicite.
- Google Search Console, rapport Pages : le statut "URL alternative avec balise canonique correcte" indique les pages dont Google a accepté le canonical. Le statut "URL canonique non sélectionnée par Google" signale les cas où Google a ignoré votre canonical et en a choisi un autre. C'est souvent révélateur d'un problème de cohérence.
- Vérification manuelle : dans les DevTools Chrome, onglet "Elements", chercher
<link rel="canonical">dans le head de la page. Vérifier que l'URL pointe bien vers la version attendue avec son protocole (https), son domaine canonique (www ou sans www) et son slash final ou non selon la convention choisie.
Questions fréquentes
Quand faut-il utiliser une balise canonical ?
Dès qu'une page peut être accessible via plusieurs URLs (paramètres de tracking, filtres e-commerce, variantes de produit, versions print). La canonical indique à Google l'URL de référence à indexer. Sans elle, Google choisit lui-même une URL canonique, parfois mal. Mettre une canonical auto-référente sur toutes les pages d'un site est une bonne pratique préventive.
Google respecte-t-il toujours la balise canonical ?
Non, c'est un "hint", pas une directive stricte. Google peut décider d'ignorer une canonical s'il juge que la page indiquée n'est pas la meilleure pour l'utilisateur. Pour vérifier la canonical retenue par Google, utiliser Inspection d'URL dans la Search Console : la "URL canonique sélectionnée par Google" peut différer de celle déclarée dans le HTML.
Canonical vers une URL externe, est-ce possible ?
Oui, c'est appelé "cross-domain canonical". C'est utilisé pour les contenus syndiqués : si vous republiez un article sur Medium ou LinkedIn, la canonical sur Medium peut pointer vers votre site d'origine. Google indexe alors la version canonique. Attention : cette pratique ne fonctionne que si la version originale est facilement accessible aux crawlers.
Faut-il une canonical sur chaque page d'un site ?
Oui, recommandé. Une canonical auto-référente (canonical pointant vers l'URL de la page elle-même) protège contre les URLs parasites créées par des paramètres de tracking (?utm_source=...), des liens entrants malformés ou des pratiques externes. C'est une assurance simple à implémenter et qui évite beaucoup de problèmes de duplicate content involontaire.