Balise link rel canonical dans le head HTML pointant vers l'URL de référence d'une page

Ce qu'est la balise canonical

La balise canonical est un élément HTML placé dans le <head> d'une page. Elle indique aux moteurs de recherche quelle URL est la version "officielle" d'un contenu donné. En termes techniques, on appelle ça signaler l'URL canonique.

Sa syntaxe est simple :

<link rel="canonical" href="https://monsite.com/ma-page/" />

Quand Google rencontre cette balise sur une page, il comprend que c'est l'URL indiquée qui doit être indexée et positionnée. Les éventuelles autres versions (avec paramètres, en HTTP, sans slash final…) sont ignorées pour le classement.

Canonical vs redirection 301 : quelle différence ?

La redirection 301 renvoie l'utilisateur et les robots vers une nouvelle URL. La balise canonical laisse les pages accessibles mais désigne laquelle doit compter en SEO. On utilise le canonical quand on veut garder les pages actives (pour l'expérience utilisateur ou les campagnes publicitaires) sans diluer l'autorité entre plusieurs versions.

Quand utiliser la balise canonical

La balise canonical n'est pas réservée aux cas extrêmes. Voici les situations concrètes où elle est utile, voire indispensable.

Situation Problème sans canonical Solution
Paramètres d'URL (tracking, filtres, tri) Google voit des dizaines de variantes de la même page Canonical vers l'URL propre sans paramètre
Contenu syndicué (republié sur d'autres sites) Le contenu original peut être déclassé au profit d'une copie Le site qui republie pointe son canonical vers l'original
Versions HTTP et HTTPS coexistantes Autorité divisée entre deux protocoles Canonical vers la version HTTPS + redirection 301
Pagination (/page/2/, /page/3/…) Contenu partiel répété, signaux dilués Canonical vers la page principale (si les sous-pages n'ont pas de valeur propre)
Fiches produit avec variantes (taille, couleur) Plusieurs URLs quasi-identiques Canonical vers la fiche principale

Les erreurs courantes avec le canonical

La balise canonical est facile à mal implémenter. Ces erreurs reviennent régulièrement dans mes audits.

  1. Le canonical pointe vers la mauvaise URL

    Sur certains CMS, une mauvaise configuration génère des canonicals qui pointent vers la page d'accueil ou vers elles-mêmes mais avec une URL incorrecte. Résultat : Google ignore le signal ou le considère comme incohérent.

  2. Canonical en conflit avec une redirection

    Si la page A a un canonical vers B, mais que B redirige vers C, Google ne sait pas quoi indexer. Les signaux doivent être cohérents et alignés.

  3. Chaîne de canonicals

    A pointe vers B qui pointe vers C. Google ne suit généralement pas plus d'un niveau. Le canonical doit pointer directement vers la version finale.

  4. Canonical absent sur les pages à paramètres

    Un site e-commerce sans canonical sur ses pages filtrées peut générer des centaines d'URLs dupliquées que Google explore inutilement, consommant le budget de crawl.

Le canonical externe : republier sans risque

Le canonical peut aussi pointer vers un autre domaine. C'est la clé pour republier du contenu sur des plateformes tierces (Medium, LinkedIn Articles, presse spécialisée) sans risquer de pénalité pour duplicate content.

Si un magazine en ligne publie l'un de mes articles, il peut insérer dans son code un canonical qui pointe vers l'URL originale sur mon site. Résultat : il garde la page accessible pour ses lecteurs, mais Google sait que la version de référence est la mienne.

Le canonical est un signal, pas une directive. Google peut choisir de l'ignorer s'il juge que l'URL indiquée n'est pas la meilleure version. En pratique, il suit le canonical dans la très grande majorité des cas, mais des incohérences dans la structure du site peuvent le conduire à passer outre.

Canonical vs noindex : lequel choisir ?

Canonical et noindex sont deux façons différentes de dire à Google de ne pas indexer une version d'une page. Choisir la mauvaise solution crée des problèmes.

Situation Canonical Noindex
Page de filtre e-commerce (/chaussures/?couleur=rouge) Préféré : la page reste accessible, le canonical consolide l'autorité vers la page principale Possible, mais la page n'est plus accessible via les filtres si mal géré
Page de confirmation de commande Non adapté : la page n'a pas de version équivalente à désigner Préféré : la page n'a aucune valeur SEO, on l'exclut complètement
Contenu republié sur un autre site Préféré sur le site tiers : pointe vers l'original pour consolider l'autorité Non adapté : prive la page tierce de valeur sans raison
Page de pagination (/blog/page/3/) Si les pages de pagination n'ont pas de valeur propre : canonical vers la page principale Si on veut les exclure totalement de l'index

La règle de décision : si la page a de la valeur pour l'utilisateur et doit rester accessible, mais ne doit pas être indexée, utilisez un canonical vers la version de référence. Si la page n'a aucune valeur (confirmation de commande, page de connexion), utilisez noindex.

Comment vérifier et auditer les balises canonicals

Les erreurs de canonical passent souvent inaperçues parce qu'elles ne génèrent pas d'erreur visible. Il faut les chercher activement.

Questions fréquentes

Quand faut-il utiliser une balise canonical ?

Dès qu'une page peut être accessible via plusieurs URLs (paramètres de tracking, filtres e-commerce, variantes de produit, versions print). La canonical indique à Google l'URL de référence à indexer. Sans elle, Google choisit lui-même une URL canonique, parfois mal. Mettre une canonical auto-référente sur toutes les pages d'un site est une bonne pratique préventive.

Google respecte-t-il toujours la balise canonical ?

Non, c'est un "hint", pas une directive stricte. Google peut décider d'ignorer une canonical s'il juge que la page indiquée n'est pas la meilleure pour l'utilisateur. Pour vérifier la canonical retenue par Google, utiliser Inspection d'URL dans la Search Console : la "URL canonique sélectionnée par Google" peut différer de celle déclarée dans le HTML.

Canonical vers une URL externe, est-ce possible ?

Oui, c'est appelé "cross-domain canonical". C'est utilisé pour les contenus syndiqués : si vous republiez un article sur Medium ou LinkedIn, la canonical sur Medium peut pointer vers votre site d'origine. Google indexe alors la version canonique. Attention : cette pratique ne fonctionne que si la version originale est facilement accessible aux crawlers.

Faut-il une canonical sur chaque page d'un site ?

Oui, recommandé. Une canonical auto-référente (canonical pointant vers l'URL de la page elle-même) protège contre les URLs parasites créées par des paramètres de tracking (?utm_source=...), des liens entrants malformés ou des pratiques externes. C'est une assurance simple à implémenter et qui évite beaucoup de problèmes de duplicate content involontaire.