Qu'est-ce qu'une erreur 404 ?
L'erreur 404 est un code HTTP qui signifie que la page demandée n'existe pas (ou n'existe plus) sur le serveur. Quand un internaute clique sur un lien mort, quand Googlebot tente d'explorer une URL supprimée ou quand vous tapez une adresse incorrecte, le serveur renvoie ce code.
Le code 404 est une réponse normale du protocole HTTP. Elle n'est pas catastrophique en soi. Ce qui compte, c'est le nombre de 404 présentes sur un site, leur nature (pages importantes ou marginales) et la façon dont elles sont gérées.
L'impact SEO des erreurs 404 selon leur nature
Toutes les 404 n'ont pas le même impact. Voici un tableau de priorisation selon le type de page concernée.
| Type de page en 404 | Impact SEO | Priorité de traitement |
|---|---|---|
| Page qui recevait du trafic organique significatif | Perte immédiate de positionnement et de trafic | Urgente |
| Page qui reçoit des backlinks externes | Perte de l'autorité transmise par ces liens | Urgente |
| Page pointée par des liens internes | Mauvais UX, PageRank gaspillé | Haute |
| Centaines de pages satellites de faible valeur | Gaspillage du budget de crawl de Googlebot | Moyenne |
| URL parasites jamais liées et sans trafic | Négligeable si en faible nombre | Basse (à nettoyer en batch) |
Comment détecter les erreurs 404
Plusieurs sources complémentaires permettent d'identifier les 404 d'un site.
- Google Search Console, rapport "Pages" (ex-Couverture) : liste les URLs que Googlebot a tenté de crawler et qui retournent une erreur 404. C'est la source la plus fiable car elle reflète ce que le robot voit réellement. Filtrez par "Page introuvable" pour isoler les 404.
- Screaming Frog : en crawlant votre site, l'outil identifie toutes les URLs internes qui retournent un code 404, y compris celles pointées par des liens internes. Exportez la liste et filtrez par code de réponse.
- Ahrefs ou Semrush : pour les backlinks, ces outils signalent les liens externes qui pointent vers des pages 404 sur votre site. C'est la source pour identifier les 404 prioritaires à rediriger.
- Google Analytics / GA4 : en filtrant les pages dont le titre contient "404" ou "introuvable", vous voyez combien de visiteurs réels tombent sur des erreurs et depuis quelles sources (recherche organique, liens directs, références).
Comment prioriser les 404 à corriger
Sur un site de taille moyenne, il peut y avoir des centaines de 404. Impossible de toutes les traiter en même temps. Voici la logique de priorisation que j'applique en audit.
-
Identifier les 404 avec des backlinks entrants
Exportez depuis Ahrefs ou Semrush la liste des pages 404 qui reçoivent des liens externes. Chaque lien vers une 404 est de l'autorité perdue. Ces URLs sont les premières à rediriger en 301 vers la page équivalente la plus proche.
-
Identifier les 404 avec du trafic organique historique
Dans Google Analytics, filtrez les URLs en erreur 404 et regardez leur trafic sur les 12 derniers mois. Une page qui recevait 500 visites/mois et a été supprimée représente une perte réelle à récupérer.
-
Corriger les liens internes cassés
Screaming Frog liste tous les liens internes qui pointent vers des 404. Mettez-les à jour URL par URL ou via une redirection. Un lien interne cassé est du maillage interne gaspillé et une mauvaise expérience pour l'utilisateur.
-
Traiter les 404 générées par des erreurs de crawl
Certaines 404 signalées dans la Search Console n'existent que dans des sitemaps obsolètes ou des liens de commentaires. Si elles ne reçoivent ni trafic, ni liens, ni signaux internes : laissez-les en 404 et nettoyez la source.
Mettre en place les redirections correctement
La redirection 301 est la solution standard pour transférer l'autorité d'une URL supprimée vers son équivalent. Quelques règles importantes :
- Rediriger vers la page la plus pertinente : si une page de catégorie est supprimée, redirigez vers la catégorie parente, pas systématiquement vers l'accueil. Une redirection vers l'accueil sur une URL spécifique est un signal de redirection "soft" que Google peut dévaloriser.
- Éviter les chaînes de redirections : A → B → C est à éviter. Chaque saut dilue la transmission d'autorité et ralentit le chargement. Après une migration, vérifiez que vos anciennes redirections ne pointent pas vers de nouvelles 301.
- Ne pas rediriger toutes les 404 vers l'accueil : rediriger 500 URLs différentes vers la page d'accueil via un joker est une pratique que Google reconnaît et peut ignorer. Chaque redirection doit pointer vers la destination la plus pertinente thématiquement.
Concevoir une page 404 utile
La page 404 ne change pas le code HTTP renvoyé (qui reste 404), mais une page bien conçue retient les visiteurs au lieu de les faire repartir. Voici ce qu'elle doit contenir.
| Élément | Pourquoi le mettre |
|---|---|
| Message clair qui explique ce qui s'est passé | Le visiteur doit comprendre qu'il est sur une page d'erreur, pas sur un bug |
| Moteur de recherche interne | Permet au visiteur de retrouver ce qu'il cherchait sans quitter le site |
| Liens vers vos pages les plus visitées | Oriente le trafic plutôt que de le perdre |
| Lien vers la page d'accueil | Option de repli universelle |
| Navigation principale visible | L'entête avec le menu permet de repartir dans n'importe quelle direction |
Vérifiez que votre page 404 personnalisée retourne bien un code HTTP 404 et pas un code 200. Une page 404 qui retourne un code 200 est une soft 404 aux yeux de Google. Vous pouvez vérifier avec un outil comme httpstatus.io en entrant l'URL d'une page inexistante de votre site.
404 après une migration : la situation la plus risquée
La grande majorité des 404 critiques apparaissent après une migration de site ou une refonte. Les URLs changent, les anciens liens ne sont pas redirigés, et Google perd le fil de l'indexation existante. C'est pourquoi je recommande systématiquement d'établir un plan de redirections complet avant toute mise en ligne, en mappant chaque ancienne URL vers sa nouvelle destination.
La Google Search Console est l'outil de surveillance indispensable dans les semaines qui suivent une migration : vérifiez quotidiennement les nouvelles erreurs signalées dans le rapport "Pages".
Questions fréquentes
Toutes les erreurs 404 sont-elles mauvaises pour le SEO ?
Non, et c'est une idée reçue tenace. Une 404 sur une URL parasite jamais liée, jamais visitée, sans backlink, ne pénalise rien. Google les ignore. Les 404 problématiques sont celles qui touchent des pages qui recevaient du trafic ou des backlinks. Le nombre brut de 404 dans la Search Console n'a pas grande importance, c'est la nature des pages concernées qui compte.
Faut-il rediriger toutes les 404 en 301 ?
Non. Une 410 (Gone) est préférable pour signifier qu'une page a été volontairement supprimée et qu'aucune URL ne la remplace. Une 301 doit toujours pointer vers une page équivalente : si aucune équivalence n'existe, laisser une 410 propre est plus honnête côté algorithme et plus rapide à intégrer pour Google.
Qu'est-ce qu'une soft 404 et pourquoi est-ce gênant ?
Une soft 404 est une page qui retourne un code HTTP 200 (succès) alors qu'elle n'a pas de contenu utile : "page non trouvée", résultats de recherche vides, page produit en rupture sans alternative. Google les détecte et les signale. Le problème : elles polluent l'index avec des pages vides au lieu d'envoyer un signal clair. Toujours retourner un vrai code 404 ou 410 sur les vraies erreurs.
Combien de temps Google teste-t-il une URL en 404 avant de la désindexer ?
En général entre quelques semaines et plusieurs mois. Google revient régulièrement vérifier une URL qu'il a connue, même longtemps après sa disparition. Une 410 (Gone) accélère la désindexation par rapport à une simple 404 car elle signale une suppression volontaire. Pour les URLs définitivement supprimées sans alternative, préférer 410.