Les sitemaps XML, meilleurs amis du référenceur ?

cacfd3
Posté par Lydie Padilla à 12:00

Un plan de site XML regroupe l’ensemble des URLs d’un site ainsi que leurs métadonnées associées. Généralement accessible via l’URL http://www.example.com/sitemap.xml, ce type de plan de site indique précisément aux robots des moteurs de recherche l’ensemble des pages à visiter, ce qui est un des moyens de prévenir ou de pallier les problèmes d’indexation, bien que ce ne soit pas infaillible.

Un fichier Sitemap correspond à un protocole dont les tenants et aboutissants sont expliqués sur le site Sitemaps.org (en plusieurs langues): il doit être enregistré avec un codage UTF-8, le nombre d’URLs maximum est de 50 000 et le poids total du fichier ne peut dépasser 10 Mo (10 485 760 octets).

google_spiderSource de l’image : metropublisher.com

Pourquoi utiliser un sitemap ?

Comme évoqué plus haut, les plans de site XML aident à pallier les problèmes d’indexation des sites contenant notamment des contenus dynamiques ou des pages avec des contenus en AJAX ou Flash.

Il est fortement recommandé d’accompagner la création d’un site avec celle d’un sitemap. En effet, les robots des moteurs explorent les sites en allant d’un lien à l’autre et si votre site est récent, il ne disposera pas d’un grand éventail de liens pointant vers ses pages, notamment vers les URLs les plus profonds.

De manière générale, un sitemap XML permet aux robots de repérer et d’indexer les pages solitaires, bien qu’il soit fortement conseillé de doter son site d’un maillage de liens permettant aux moteurs d’identifier l’ensemble des pages, mais aussi leur hiérarchie.

Comment créer un sitemap XML

Cet extrait correspond à l’entrée d’un URL dans un plan de site. Les balises en italique sont facultatives.

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url
</urlset>

Bien que facultatives, les balises suivantes s’avèrent tout à fait intéressantes.

La balise <changefreq>monthly</changefreq> identifie la fréquence de modification de la page. « Never » doit ainsi être utilisé si la page est archivée.  Cependant, ces balises ne sont que des indications pour les robots des moteurs de recherche, cela ne garantit en rien la fréquence de visite de ces pages. Une page notifiée « hourly » pourrait très bien être moins souvent visitée qu’une page marquée « never ».

La balise <priority>0.8</priority> identifie la hiérarchie des pages au sein d’un même site uniquement. Spécifier la valeur des priorités des pages n’aide en aucun cas à obtenir un meilleur positionnement dans les résultats de recherche. En  revanche, cela a l’immense avantage de différencier aux robots les pages principales des pages secondaires, ce qui soutient le travail d’optimisation SEO et l’attribution des mots clés aux différents URLs en termes de volume de recherche et de pertinence. Par défaut, la priorité est fixée à 0,5. Avis aux petits malins qui désireraient jouer de ruse avec les moteurs, il est absolument inutile de donner la valeur maximale à l’ensemble des URLs.

Pourquoi doter son site de plusieurs sitemaps ?

Un site internet est composé d’URLs correspondant à plusieurs types de contenus : des pages web classiques, mais aussi des images, des vidéos ou encore des contenus mobiles. Pour soumettre à l’index des moteurs de recherche l’ensemble de ces contenus, l’usage de sitemaps différenciés est recommandé. Chacun de ces fichiers XML sera regroupé dans un fichier racine http://www.exemple.com/sitemap_index.xml indiquant aux robots l’ensemble des plans de site XML d’un seul et même site. Pour les sous-domaines, il faudra procéder de manière indépendante.

balise-sitemaps
Voici l’exemple d’un index de sitemap contenant deux entrées :

<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>

Sitemaps et contenus multimédias

Alors que les vidéos ou les infographies ne cessent de gagner en popularité parmi les résultats de recherche, leur indexation devient un enjeu majeur de référencement. C’est pour cette raison que spécifier les contenus multimédias au sein de sitemaps XML est particulièrement recommandé.

Chaque entrée d’un sitemap vidéo permet de spécifier aux robots des moteurs un certain nombre d’informations précieuses pour le référencement. Vous devrez renseigner les informations suivantes : titre, description, URL de la page de lecture, URL de la vignette et URL de la vidéo brute ou URL du lecteur Flash. Les formats supportés sont .swf, .mpg, .mpeg, .mp4, .mov, .wmv, .asf, .avi, .ra, .ram, .rm, .flv

Les entrées d’un sitemap images permettent de fournir des informations supplémentaires qui viennent compléter la seule balise ALT. Outre le titre, une légende ou une indication de localisation peut être fournie. Un sitemap image permet également d’indexer les images contenues dans des pages codées en JavaScript ou d’attribuer des priorités aux différentes images associées à un URL.

sitemap-image

Soumettre votre sitemap aux moteurs de recherche

Une fois votre sitemap crée, il est temps de le soumettre aux moteurs de recherche supportant ce protocole. Pour ce faire, plusieurs moyens sont à votre disposition :

1. Vous pouvez le fournir directement aux moteurs selon leurs propres règles.

2. Vous pouvez utiliser votre robots.txt afin de spécifier son emplacement comme ici :
Sitemap: http://www.exemple.com/sitemap.xml

3. Vous pouvez envoyer une requête http à l’aide de wget ou de curl par exemple.

4. Une fois votre site inscrit à Google Webmaster Tools, vous pouvez soumettre votre sitemap par le biais de cette plateforme.

En cas de modification ou d’ajout de nouvelles entrées, vous devez soumettre de nouveau votre sitemap aux moteurs de recherche, ce qui est tout à fait possible en utilisant Webmaster Tool. En 5 jours, votre sitemap devrait être pris en compte. Si vous éprouviez des difficultés, vous pouvez consulter cette ressource de dépannage http://www.google.com/support/webmasters/bin/answer.py?answer=178644.

Outils et ressources :

XML.com (en anglais)
W3.org (en anglais)
Centre d’aide pour les Webmasters – à propos des sitemaps (en français)



Articles relatifs :


Tags :

indexation, plan de site, seo, sitemap XML, URL



Trackbacks



10 Commentaires

  • Quentin a dit le 1 août 2011 à 17:03 :

    Merci
    même que je connaissait déjà

  • Jérôme - blog marketing a dit le 1 août 2011 à 18:24 :

    Je me suis toujours demandé à quoi pouvait vraiment servir un sitemap. Je sais que parfois il est difficile d’indexer des pages profondes, mais avec un bon maillage il ne devrait pas y avoir de problèmes. Sauf bien sur pour des sites énormes.

    De plus les balises et je pense que Google n’en fait de toutes les facons qu’a sa tête, si le contenu n’évolue pas, google ne revient pas.

    Je n’est pas de certitudes sur ce que je dis, ce n’est qu’un simple avis.

  • Jerome a dit le 3 août 2011 à 11:23 :

    Bonjour
    Et merci pour cet article éclairant. Largement débutant dans ce domaine, je souhaite réaliser un sitemap sur un site dynamique comportant de très nombreuses pages L’utilisation d’outils tels que Yooda est elle une piste à explorer ?

  • Jonathan - @alineowebdesign a dit le 12 août 2011 à 12:17 :

    Je vous conseille aussi ce site qui génère automatiquement un fichier sitemap : http://www.xml-sitemaps.com/

    Merci pour l’article!

  • Jean | Travail à domicile a dit le 2 septembre 2011 à 08:23 :

    Merci pour l’article. On se demande comment certaines sociétés facturent cher pour l’”inscription” sur les moteurs de recherches alors que la sitemap est le bon moyen

  • Nicolas Bouliane de Granby a dit le 12 octobre 2011 à 15:04 :

    La meilleure option pour les utilisateurs de WordPress est de télécharger XML Sitemaps. L’extension fait tout pour vous, et ping ensuite Google.

  • Création de site web a dit le 31 octobre 2011 à 15:12 :

    Un moyen simple mais efficace pour que aucun contenu du site ne passe à la trappe.

  • Parapharmacie Vitalya a dit le 17 décembre 2011 à 05:16 :

    Merci pour cet article. Je viens de découvrir que mon sitemap produit calcule la propriété priority sur le nombre de ventes. Un produit qui se vend beaucoup prend la priorité 1 tandis qu’une faible rotation 0.1.

  • bilel militi a dit le 28 avril 2012 à 06:28 :

    je voudrais une methode pour générer un fichier sitemap.xml pour mon site par programation (php),exemple un boucle pour genérer tou les urls du mon site.
    mon email est : bilelm3@gmail.com

  • jean francois a dit le 30 avril 2013 à 20:06 :

    Bonjour, avec un fichier sitemap, google ira t’il quand même chercher une URL non référencée dans le sitemap mais présent via un lien sur la page d’acceuil ? J’ai un blog présent sur le site mais qui n’est pas détecté par le generateur de sitemap. La seule chose qui le lie au site est un lien dans un des blocs.. Google ira t’il le voir ?

Commentez cet article