Fichier sitemap XLM : un essentiel SEO

06 octobre 2024 - Frédérique Biau
SEO
6409 vues

12 minutes

Demandez à n'importe quel expert en SEO, il vous dira qu'avoir un sitemap pour son site web est un must absolu ! 

Les sitemaps XML (ou plans de site) existent depuis des lustres… La question est de savoir s'ils sont toujours pertinents pour le référencement, aujourd'hui, en 2022.

Ce document répertorie les pages les plus importantes d'un site web. 

Et son rôle n’est pas des moindres :

  • Car il permet aux moteurs de recherche de trouver lesdites pages, de les explorer et de les classer

  • Mais il aide également à comprendre la structure du site, ce qui en facilite la navigation.

Alors, qu'est-ce qu'un plan de site, et quelle est son importance réelle pour le SEO ? On fait le tour de la question avec vous !

Sitemap XML, définition : un plan de site, mais qu’est-ce que c’est au juste ?

Vous avez créé un magnifique site internet, avec du super contenu et un magnifique design. 👍

Et bien évidemment, vous souhaitez à présent que Google en explore chaque page, afin d’obtenir le meilleur positionnement possible… 

C’est tout naturel !

Or, il arrive que parfois, certaines pages se retrouvent orphelines : c'est-à-dire sans aucun lien interne pointant vers elles, ce qui les rend invisibles pour tout visiteur de votre site.

C’est là qu’entre en jeu le fameux sitemap.

En termes simples, un plan XML est une liste des URLs de votre site internet.

Un sitemap efficace agit comme une carte routière : il permet aux moteurs de recherche de localiser instantanément toutes vos pages importantes - que vous ayez, ou non, un bon maillage de liens internes.

fichier sitemap

A quoi sert un plan de site ? Que contient un sitemap ?

Un plan de site est un fichier, dans lequel vous fournissez des informations détaillées sur toutes les pages, leurs relations et leurs contenus (images, vidéos...).  

Les moteurs de recherche comme Google parcourent ce document pour explorer votre site plus efficacement.

👉 Les URLs internes du site

La première fonction du sitemap est tout simplement de répertorier les URLs internes d'un site. 

L'avantage du format XML est qu'il permet d'ajouter des métadonnées, qui vont enrichir cette liste. On peut notamment ajouter :

  • Une dimension temporelle, comme la date de la dernière modification.

  • La fréquence de modification.

  • Le degré d'importance de l'URL dans le linking interne du site.

👉 Images et vidéos

Dans la majorité des cas, le sitemap XML vidéo ou image n'est pas forcément utile. 

Ce, parce qu’en principe, les fichiers multimédias se trouvent au sein des pages déjà présentes dans la liste d’URLs. Ils sont donc logiquement explorés en même temps que la page

Cependant, certains sites peuvent faire exception, comme les portfolios (de photographes, d’architectes, de web designers…). Dans ces cas précis, il peut être judicieux de réaliser un sitemap XML pour faire le distingo entre les médias et images, et les pages de contenu textuel.

Pour fournir à Google des informations utiles sur vos images, vous devez ajouter des détails pertinents, tels que le type d'image, le sujet, la légende, le titre, l'emplacement, etc.

sitemap

Source de l’image : Webrankinfo.com

Plan de site XML : pour qui ?

Si les pages de votre site sont correctement liées entre elles, Google peut normalement naviguer sans problème, sur la majeure partie de votre site. 

Un maillage correct signifie que toutes les pages que vous jugez importantes peuvent être atteintes d’une façon ou d’une autre, par la navigation (menu ou liens). 

Malgré tout, créer un sitemap peut améliorer l'exploration de sites plus grands ou plus complexes, ou de fichiers plus spécialisés.

De façon plus précise, vous aurez besoin d'un plan de site si :

  • Votre site est très volumineux. Par conséquent, il est probable que les robots de Google ne parviennent pas forcément à explorer l’ensemble de vos pages nouvelles ou récemment mises à jour.
  • Votre site comporte de nombreuses pages isolées ou mal reliées les unes aux autres. 

  • Votre site vient d’être créé, et comporte peu de backlinks (liens entrants provenant d’autres sites). 

  • Votre site comporte beaucoup de contenu multimédia (vidéo, images), ou figure dans Google Actualités. 

A l’inverse, vous n'aurez peut-être pas besoin d'un sitemap si :

  • Votre site est "petit". Par petit, nous entendons environ 500 pages ou moins. 

  • Votre maillage interne est très bien ficelé (vous maîtrisez notamment parfaitement votre profil de liens, y compris l'équilibre entre vos liens nofollow et dofollow). Cela signifie que Google peut trouver toutes les pages importantes de votre site, rien qu’en suivant les liens, à partir de la page d'accueil.

  • Vous n'avez pas beaucoup de fichiers multimédias ou de pages d'actualité. 

Attention
Info warning

Il peut être tentant de faire le raccourci : sitemap = indexation de toutes les pages. 

En réalité, celui-ci n'a qu'une influence indirecte. 

Le plan de votre site permettra effectivement à Google de trouver vos pages, mais ce dernier restera seul juge de leur qualité, et de l'utilité de les indexer ou non.

 

Comment créer un sitemap efficace pour son site ? 

Voici comment faire un sitemap pour votre site, en quelques étapes…

Sitemap d’un site web, avant de commencer

Avant de commencer à concevoir un sitemap, vous devez vous demander quelles sont les pages qui méritent d'être incluses. 

Il existe un moyen extrêmement simple pour trancher, il faut se demander lesquelles sont suffisamment pertinentes

  • Cette page valorise-t-elle votre image de marque ? 

  • Répond-elle à un besoin de l'utilisateur ?...

➡️ Si une page ne vous semble pas satisfaisante, ne l'incluez pas. 

Attention
Info warning
Si vous excluez une page du sitemap, cela ne signifie pas pour autant qu'elle ne sera pas indexée ou explorée. Si vous voulez qu’elle n’apparaisse pas dans les résultats de recherche, il sera nécessaire d’ajouter une méta balise noindex.

Créer son propre sitemap

Vous pouvez concevoir votre propre plan de site de différentes manières :

1️⃣ Manuellement, en créant un fichier XML 

Cette méthode n'est généralement pas recommandée, sauf si vous savez vraiment ce que vous faites ! Il est a minima conseillé d'utiliser un éditeur XML, pour créer ce type de fichier.

2️⃣ En réalisant un développement spécifique pour votre site 

Cette technique est sans doute la plus puissante, et s'adaptera à toutes les problématiques de votre  site. Mais attention, c'est aussi la plus coûteuse. 

3️⃣ En utilisant un outil de génération automatique de sitemap (facilement trouvable sur Google)

Cette méthode est tentante : très peu de travail, pour un résultat professionnel ! Mais soyez prudent, elle présente un inconvénient : si vous changez quoi que ce soit, vous devez redémarrer le générateur à chaque fois.

4️⃣ En créant votre site sur un website builder, comme SiteW ! 

En effet, chez nous, le sitemap est généré automatiquement. Ainsi, Google sait absolument tout de vos pages web, sans que vous ayez besoin de vous en préoccuper du tout !

sitew page d'accueil

Les règles à suivre pour faire son sitemap soi même

  • Le fichier XML doit être enregistré en UTF-8.

  • Un sitemap ne peut répertorier qu'un maximum de 50 000 URL et la taille du fichier XML ne doit pas dépasser 50 Mo (52 428 800 octets).

  • Toutes les URL répertoriées dans un fichier XML sitemap doivent provenir du même hôte, comme mon-domaine.com, par exemple.

  • Votre sitemap doit être structuré au format XML (sitemap.xml). 

Il existe des plugins ou des outils tiers (comme Rarchy ou Screaming Frog) qui vous aideront à générer votre sitemap, quel que soit votre prestataire de web design.

rarchy

screaming frog

Quoi qu'il en soit, une fois votre sitemap créé, il est recommandé d'y jeter un coup d'œil manuellement.

Votre sitemap se trouve généralement à l'adresse : site.com/sitemap.xml. 

Toutes les pages de votre site devraient y être affichées.

Si tout semble correct, il est temps de soumettre votre sitemap à Google…

Soumettre son plan du site à Google

Pour soumettre votre sitemap sur Google Search Console (GSC):

  • Commencez par vous connecter à votre compte GSC.

  • Ensuite, allez dans "Index" → "Sitemaps", dans la barre latérale.

  • Saisissez l'URL de votre sitemap dans ce champ

  • Enfin, cliquez sur "Envoyer".

💡 Sur SiteW, vous n’avez, encore une fois, pas besoin de procéder à cette étape : nous nous chargeons pour vous, de la soumission à Google Search Console, de façon totalement automatique.
 

Plan de site : informations techniques 

Un fichier XML est constitué d’un ensemble de balises, que Google pourra lire et traiter, afin de comprendre toutes les données transmises, et classer les pages en conséquence.

👉 La balise <urlset>

Obligatoire, cette balise englobe le fichier sitemap, et référence le standard de protocole utilisé.

👉 La balise <url>

Également obligatoire, cette balise représente la balise parent, pour chaque URL référencées.

👉 La balise <loc>

La balise <loc> est la dernière des trois balises obligatoires. Elle représente l'URL de la page. Elle contient la version absolue et canonique de l'emplacement de l'URL. 

Celle-ci doit nécessairement commencer par l'intitulé du protocole (http://, https://), et ne doit pas comporter plus de 2048 caractères. 

Pour les sites web internationaux, c'est également ici que vous pouvez mettre en œuvre votre traitement hreflang. 

En utilisant l'attribut xhtml:link pour indiquer les variantes de langue et de région pour chaque URL, vous réduisez le temps de chargement de la page.

👉 La balise <lastmod>

Cette balise est facultative, mais fortement recommandée. Elle informe de la date de la dernière modification du fichier ou de la page. 

Pour une question de simplicité, on utilise généralement le format AAAA-MM-JJ.

L'heure de la dernière modification est particulièrement critique pour les sites de contenu, car elle aide Google à comprendre que vous êtes l'éditeur original.

👉 La balise <changefreq>

Cette balise est également facultative. Elle représente la fréquence de modification de la page. 

Les valeurs acceptées sont : "always", "hourly", "daily", "weekly", "monthly", "yearly" et "never".

La valeur "always" doit être utilisée pour décrire des documents qui changent à chaque accès. La valeur "never" doit être utilisée pour les URLs qui sont considérées comme archivées.

fichier sitemap

Source de l’image : Slapdigital.fr

👉 La balise <priority>

La balise <priority> est la dernière des trois balises facultatives. Elle représente la priorité d'une page, par rapport aux autres pages du site. 

Les valeurs acceptées sont comprises entre 0,0 et 1. Par défaut (sans balise <priority>), la priorité d'une page est égale à 0.5.

Créer un sitemap pour son site : nos conseils pour optimiser son utilisation

Votre site est énoooorme ? Il contient une très grande quantité de pages ?

N’hésitez pas à générer plusieurs plans de site, pour le même site. 

En effet, comme vu plus haut, les sitemaps sont limités en matière de taille (50 000 URLs et 50 Mo).

Au delà de ces contraintes, dans certains cas, il est judicieux de diviser votre fichier XML :

  • Créez différents sitemaps, en fonction des types de pages (catégories, produits, articles..).

  • Réalisez plusieurs plans de site, selon les langues utilisées. Si vous avez un site multilingue, c'est une bonne idée de séparer votre sitemap, en en créant un par langue. 
  • Si les pages de votre site ciblent plusieurs pays différents, vous devez également compartimenter votre plan de site par rapport à cette donnée.

Tous ces sitemaps peuvent ensuite être combinés en un seul fichier XML d'index de sitemaps, souvent nommé sitemap-index.xml.

Erreurs courantes lors de la génération d’un sitemap

Lorsqu’on touche à des manipulations un peu techniques, il n’est pas rare de commettre des erreurs. Voici quelques écueils dans lesquels il faut éviter de tomber :

👉 Mauvais protocole utilisé

Il arrive que le sitemap n'utilise pas le bon format d’URL. Par exemple, il n'inclut pas "www", ou affiche "HTTP" au lieu de "HTTPS".

👉 Mauvaise mise en œuvre des règles de réécriture

Lorsque le sitemap ne fonctionne pas sur un serveur Apache ou Nginx, il est très probable qu'il y ait une erreur dans la mise en œuvre des règles d'écriture.

👉 Intégration d'URLs interdites pour l'indexation

Parfois, sans s'en rendre compte, on génère un sitemap contenant des URLs bloquées par le fichier robots.txt. En règle générale, Google signale ce type d'erreur. 

👉 Un sitemap non segmenté

Les gros sites sont souvent dans l'obligation de segmenter leur fichier XML en plusieurs sitemaps, pour passer sous la limite maximale autorisée par Google.

Types de sitemaps

Il existe deux principaux types de sitemaps. Bien qu'ils aient des objectifs différents, ils sont tous deux recommandés, et ne peuvent pas nuire à votre site web.

👉 Plan Sitemap XML 

Le sitemap XML est le type de plan le plus courant. Il ne peut être compris que par les moteurs de recherche, et leur est donc explicitement dédié.

👉 Plan de site HTML 

Le sitemap HTML est celui qui peut être consulté par les internautes, et qui peut les aider à naviguer vers une page spécifique. Les sitemaps HTML sont généralement inclus dans le pied de page des sites web.

En dehors de ces deux principaux sitemaps, il existe trois autres types de plans XML, à savoir :

👉 Sitemap vidéo 

Utilisé spécifiquement pour aider les moteurs de recherche à mieux comprendre le contenu vidéo de votre site.

👉 Sitemap actualités

Utilisé spécifiquement pour aider les moteurs de recherche, à mieux trouver les contenus web approuvés pour Google Actualités. Pour de meilleurs résultats, incluez les URLs des articles publiés au cours des deux derniers jours.

👉 Sitemap images 

Utilisé spécifiquement pour aider les moteurs de recherche à trouver toutes les images hébergées sur votre site.

sitemap sitew

OK… On vient de voir comment créer un sitemap… Mais cela vous semble peut-être un peu fastidieux ? 🤯

Pas de panique, si tel est le cas, car il existe une solution bien plus simple et confortable….

Sitemap et plan de site XML : comment ça se passe sur SiteW ?

Quand vous créez un site sur notre plateforme, nous prenons en charge la création de votre sitemap.

Vous n’avez pas à vous en occuper : c’est aussi simple que cela. Nous nous chargeons également de l’envoyer sur Google Search Console.

Vous pouvez y accéder à tout moment, sur votre tableau de bord (page Mes sites > Statistiques > Console Google).

sitemap sitew

Vous avez donc également la possibilité de vous y référer, pour vérifier si vos pages sont toutes correctement indexées. Voici comment procéder…

Fichier XML Sitemap : auditer et corriger les problèmes

Une fois que vous avez transféré votre plan de site à Google :

  1. Rendez-vous sur Google Search Console, 

  2. Et cliquez sur votre sitemap, dans la section "Plans de site soumis".

google search console sitemap

Source de l’image : Yoast.com

Si vous voyez "Sitemap index processed successfully" apparaitre, cela signifie que Google a réussi à explorer votre sitemap. 

Vous pouvez également cliquer sur la petite icône en forme de barre, pour accéder au rapport concernant votre plan de site.

Ce rapport vous indique le nombre d'URLs que Google a trouvées dans votre sitemap... et le nombre de ces pages qui se sont finalement retrouvées dans l'index de Google.

👉 Que faire si quelque chose cloche ?

  • Si certaines d'entre elles affichent des erreurs, au lieu de "Opération effectuée" : vérifiez avec votre équipe technique ce qui ne va pas, et corrigez-les.

  • Si le nombre d'URLs découvertes ne correspond pas : 

    • Ouvrez le sitemap avec l'URL indiquée dans la colonne "Sitemap" à gauche, et vérifiez si le compte est correct.

    • Assurez-vous ensuite que les URLs présentes dans le(s) sitemap(s) ne sont pas désindexées (balise noindex), ou bloquées par le fichier robots.txt. Dans ce cas, supprimez-les du sitemap.

    • Vérifiez ensuite que les URLs présentes dans le(s) sitemap(s) sont à jour. Le sitemap n'étant pas obligatoire pour l'indexation, le fait qu'il ne soit pas à jour n'est pas un facteur bloquant. En revanche, il ne faut pas trop attendre pour les actualiser, si l’on veut qu’il reste efficace.

  • S'il n'y a pas de sitemap envoyé :

    • Vérifiez, auprès de votre équipe technique, s'il y a un fichier XML non déclaré.

    • Vous pouvez également tester par vous-même, en tapant dans votre navigateur "mon-domaine.com/sitemap.xml".

Conclusion sur les fichiers sitemap XML 

Même si cela ne conditionne pas directement le succès de votre site, prendre le temps de construire un sitemap cohérent est nécessaire, pour améliorer l'exploration de vos pages par les différents moteurs de recherche. 

En leur donnant un accès plus facile à certaines pages profondes, vous mettez toutes les chances de votre côté, pour les voir un jour apparaitre en haut des SERPs (pages de résultats).

 
Créez votre site internet

Simple, rapide et efficace

Frédérique Biau
Rédactrice et traductrice
Passionnée par la science-fiction, les nouvelles technologies, l’écriture et l’art en général, j’ai commencé ma carrière dans l’administration et la gestion des affaires culturelles. Et c’est avec plaisir et enthousiasme que je suis rédactrice et traductrice sur le web, depuis maintenant près de 9 ans. ✍️

Dernière mise à jour : 06 octobre 2024

Créer un site professionnel

  • 100% français
  • Sans frais cachés
  • Service clients humain