Qu'est-ce que l'arborescence d'un site ?
L'arborescence d'un site web, c'est l'organisation hiérarchique de ses pages. Elle définit quelles pages se trouvent au niveau de l'accueil, quelles catégories existent en dessous, et comment les pages de contenu se regroupent dans ces catégories.
On la représente souvent comme un arbre : le tronc est la page d'accueil, les grandes branches sont les catégories principales, et les feuilles sont les pages de contenu. Plus la page est proche du tronc, plus elle reçoit d'autorité interne et plus elle est considérée comme importante par Google.
Pourquoi l'arborescence compte pour le SEO
| Impact | Mécanisme | Conséquence si mal géré |
|---|---|---|
| Crawl facilité | Une structure claire permet à Googlebot de naviguer efficacement et d'atteindre toutes les pages | Pages profondes non crawlées, non indexées |
| Profondeur de clic | Une page accessible en 2 clics reçoit plus d'autorité qu'une page à 5 niveaux | Pages importantes enterrées = moins de pouvoir SEO |
| Maillage interne cohérent | Des catégories bien définies permettent des liens internes logiques | Liens incohérents, pages orphelines |
| Signaux thématiques | Une arborescence cohérente montre l'expertise sur un domaine | Site perçu comme généraliste, autorité diluée |
Architecture plate vs architecture profonde
Les deux modèles d'arborescence les plus courants sont l'architecture plate (peu de niveaux) et l'architecture profonde (nombreux niveaux). Chacune a ses avantages selon le type de site.
| Critère | Architecture plate (2-3 niveaux) | Architecture profonde (4+ niveaux) |
|---|---|---|
| Crawl budget | Pages atteintes rapidement, budget bien utilisé | Risque de pages profondes jamais crawlées |
| Autorité interne | Bien distribuée, toutes les pages en bénéficient | Se dilue fortement à chaque niveau supplémentaire |
| Adapté pour | Sites de services, blogs, sites institutionnels | Grands catalogues e-commerce (avec gestion du crawl) |
| Risque principal | Trop de pages au même niveau, sans hiérarchie claire | Pages importantes inaccessibles, orphelines |
Architecture et crawl budget pour les sites e-commerce
Les sites e-commerce posent des défis spécifiques d'arborescence que les sites de contenu n'ont pas. Un catalogue de 50 000 produits avec des filtres de couleur, de taille et de marque peut générer des centaines de milliers d'URLs.
- Navigation facettée : les filtres (couleur, taille, marque) créent des URLs uniques pour chaque combinaison. Sans contrôle, elles explosent le budget de crawl et créent du contenu dupliqué. La solution classique est de mettre ces URLs en
noindexou d'utiliser uncanonicalvers la catégorie principale. - Pages de pagination : les pages /page-2/, /page-3/ etc. doivent être accessibles mais gérées correctement avec les balises canonical pour éviter la dilution.
- Profondeur des catégories : un e-commerce peut avoir Accueil > Catégorie > Sous-catégorie > Produit, soit 4 niveaux. Au-delà, les fiches produits commencent à perdre en accessibilité de crawl.
Les bonnes pratiques d'une arborescence SEO
-
Concevoir l'arborescence avant de créer le site
L'arborescence se pense à partir des intentions de recherche et des besoins utilisateurs, pas à partir de l'organigramme de l'entreprise. Commencez par lister les sujets que vos cibles cherchent, regroupez-les en catégories logiques, puis construisez la hiérarchie en partant de là.
-
Limiter la profondeur à 3 niveaux pour les contenus stratégiques
Accueil / Catégorie / Page est la structure cible. Les pages au-delà de 3 niveaux reçoivent moins d'autorité interne et sont crawlées moins fréquemment. Si vous constatez des pages importantes enfouies profondément, créez des liens internes depuis des pages de niveau supérieur pour les "remonter" sans modifier les URLs.
-
Organiser par thématiques cohérentes et séparées
Chaque catégorie doit regrouper des pages qui traitent du même sujet. Une catégorie "Blog" sans sous-thématiques est une opportunité manquée. Préférez des catégories thématiques (ex. "SEO technique", "Netlinking", "Contenu") qui renforcent l'autorité thématique de votre site.
-
Créer des URLs lisibles qui reflètent la hiérarchie
Une URL propre comme
/services/audit-seo/reflète l'arborescence du site et donne un signal de contexte à Google. Évitez les URLs à paramètres ou les structures plates sans logique de dossiers pour les pages importantes. -
Mailler les pages entre elles de façon logique
L'arborescence définit la structure, mais c'est le maillage interne qui l'active. Chaque page doit recevoir des liens depuis des pages de niveau supérieur (transmission d'autorité vers le bas) et renvoyer vers des pages connexes (signal de cohérence thématique).
Les erreurs courantes à éviter
- Une arborescence trop plate : toutes les pages au même niveau, sans hiérarchie. Google ne comprend pas quelles pages sont les plus importantes et l'autorité est mal distribuée.
- Une arborescence trop profonde : des pages enfouies à 4, 5 ou 6 niveaux sont crawlées rarement et reçoivent peu d'autorité interne. Elles risquent même de devenir des pages orphelines.
- Des catégories fourre-tout : une catégorie "Divers" ou un "Blog" sans sous-catégories thématiques dilue la cohérence sémantique du site et complique le maillage interne.
- Modifier l'arborescence sans redirections : changer les URLs d'un site existant sans mettre en place des redirections 301 entraîne des pertes de positionnement et des erreurs 404 en masse. C'est l'une des erreurs les plus coûteuses en SEO.
- Calquer l'arborescence sur l'organigramme interne : les utilisateurs cherchent par besoin ou sujet, pas par département. Une arborescence "Service commercial / Direction technique / RH" ne correspond à aucune intention de recherche.
Lors d'une refonte, l'arborescence est le premier élément à retravailler. Partez d'une analyse des mots-clés et des intentions de recherche : quels sujets votre cible cherche-t-elle ? Comment les regrouper logiquement ? Les réponses à ces questions définissent votre arborescence. La structure technique vient après.
Questions fréquentes
Quelle profondeur de clic est acceptable pour Google ?
Idéalement, toutes les pages importantes doivent être accessibles en 3 clics maximum depuis la page d'accueil. Au-delà, le crawl budget peut limiter leur indexation et leur fréquence de mise à jour. Pour un petit site, viser 1-2 niveaux. Pour un e-commerce ou un site média, 3 niveaux bien structurés couvrent la plupart des besoins sans pénaliser le SEO.
Architecture plate ou profonde, quoi choisir ?
L'architecture plate (peu de niveaux, beaucoup de pages au même niveau) est plus simple à crawler mais génère des navigations complexes. L'architecture profonde (catégories et sous-catégories hiérarchisées) est plus claire pour l'utilisateur mais demande un maillage interne soigné. Pour la plupart des sites, une architecture moyennement profonde (3 niveaux) avec un bon maillage donne les meilleurs résultats SEO.
Faut-il refléter l'arborescence dans la structure d'URL ?
Pas obligatoirement. Une URL plate (/page/) fonctionne aussi bien qu'une URL hiérarchique (/categorie/sous-categorie/page/). Google se base avant tout sur les liens internes pour comprendre la structure, pas sur l'URL elle-même. L'avantage des URLs hiérarchiques : elles donnent un contexte humain. L'avantage des URLs plates : flexibilité totale, restructuration sans plan de redirections.
Comment auditer son arborescence actuelle ?
Avec Screaming Frog : crawler le site et exporter la profondeur de chaque URL ("Crawl Depth" dans l'onglet Overview). Identifier les pages stratégiques (générant du trafic, recevant des backlinks) à plus de 3 clics de l'accueil : elles méritent d'être remontées dans l'architecture, soit via un lien direct depuis l'accueil, soit via des liens depuis des pages haut placées dans la hiérarchie.