Scripts pour un Web plus performant

Google propose de créer sur son site des fichiers en XML pour améliorer l'indexation d'Internet. Il a appelé ce service sitemaps. Google offre des informations sur sitemaps. Ces informations sont en anglais mais, si besoin, vous pouvez utiliser des outils pour traduire en français. Nous vous proposons ici, gratuitement, un outil en PHP pour créer ces fichiers en XML et donc améliorer l'indexation de votre site. Pour ceux qui douteraient de l'intérêt de Sitemap nous avons créé une page présentant les avantages de Sitemap.

Cet outil est actuellement en version 0.03, il va évoluer pour pouvoir vous rendre un meilleur service. Il sera également mis à jour en fonction des améliorations apportées par Google. Par la suite il pourra être composé de plusieurs programmes.

Pour notre programme en PHP, en dehors des explications disponibles sur le site, aucune réponse ne sera fournie aux demandes d'explications. Aucun forum pour ce programme n'est disponible sur le portail Orvinfait cependant les sites des webmasters qui ouvriront des forums sur ce sujet pourront être référencés ici.

Pour pouvoir améliorer nos scripts afin de mieux répondre à vos souhaits vous pouvez nous soumettre vos remarques et suggestions d'amélioration. Nous ne vous répondrons peut-être pas (manque de temps) mais nous nous efforcerons de répondre au mieux aux attentes des webmasters en faisant évoluer nos scripts.

Le script a d'abord été conçu pour pouvoir indexer les dizaines de milliers de pages de notre site. Il analyse les sous-répertoires sur trois niveaux.

En cliquant sur le lien situé ci-dessous vous allez ouvrir un fichier txt. Vous devrez copier la totalité de ce fichier dans un éditeur de texte et le nommer avec une extension en php. N'oubliez pas de modifier les variables indiquées dans les scripts. Ensuite vous pouvez lancer le script (il ne faut pas le mettre dans un sous-répertoire). Les fichiers sitemaps sont automatiquement créés. Ils commencent tous par <<sitemap_>>.

Lorsque vous aurez lancé le programme une première fois il vous faudra mettre à jour la variable $date_premier_sitemap.

Les fichiers créés ou modifiés depuis la création du premier sitmap sont stockés dans le fichier sitemap_a_orvinfait.xml. L'un des buts de sitemap est de permettre à Google de voir rapidement les pages qui ont été modifiées ou créées. Avec cette méthode ces pages sont plus rapidement prises en compte par le moteur de recherche. Google ne perd plus de temps à vérifier la totalité des pages du site pour voir celles qui ont été modifiées et trouver celles qui ont été créées.

Si vous créez de nouvelles pages qui ne doivent pas paraître dans les moteurs de recherche n'oubliez pas de les mettre dans un ou des répertoires qui ne seront pas pris en compte (voir variables $per1 à $per5 dans le programme.). Pour les fichiers que vous ne voulez pas voir dans les moteurs de recherche le mieux est de créer un seul répertoire dans lequel vous pouvez mettre, si besoin, des sous-répertoires.

Ce programme peut être lancé tous les jours (ou plus) si vous le souhaitez en fonction des modifications de votre site.

Lorsque vos fichiers sitemap sont créés vous allez à https://www.google.com/webmasters/sitemaps/login. Vous créez un compte si vous n'en avez pas et vous soumettez http://www.votre_site/sitemap_index.gz. Ensuite vous pourrez voir sur ce compte la dernière date de lecture de votre sitemap. Google visitera régulièrement votre sitemap.

ATTENTION :

Pour le script en php, aucun nom n'est donné. Cependant il faut le mettre à la fin du nom <<.php>>. Si aucun nom n'est donné c'est pour éviter que tout le monde prenne le même. Prendre script_sitemap_cree.php n'est donc pas une bonne idée. S'il y avait un problème de protection dans le script des personnes mal intentionnées pourraient le rechercher pour détériorer les sites qui l'utilisent comme cela est arrivé pour certains forums utilisant PHPBB.

Il faut également que ce script ne paraisse pas dans les fichiers sitemap. Pour éviter cela vous pouvez interdire le fichier en l'indiquant dans le script au niveau des variables $per. Vous pouvez également, ce qui est mieux, commencer le nom de votre fichier par <<sitemap_>> et le terminer par <<.php>>. Exemple : sitemap_un_nom_code_personnel.php

Accès à la version actuelle

Google recommande d'utiliser des fichiers sitemaps compressés au format gz. Cependant tous les webmasters ne pourront pas forcément utiliser ce format. C'est pour cette raison que nous vous offrons une version qui crée des fichiers textes dont l'extension est xml.

Pour que les fichiers compressés au format gz puissent être pris en compte il faut que votre serveur ait, dans sa configuration, le type MIME pour les fichiers compressés au format gz. Si vous faites des fichiers sitemap en gz et que vous les soumettiez à Google sans que votre serveur soit bien configuré, Google ne pourra pas les lire et indiquera que votre serveur a retourné une erreur HTTP 500 error. Ceci m'est arrivé. Le serveur qui héberge mon site tourne sous Apache. J'ai donc demandé à mon hébergeur d'ajouter le type MIME suivant :

multipart/x-gzip gz,gzip,svgz

Ce qui a été fait et Google n'indique plus d'erreur. Si vous ne savez pas comment est configuré le serveur qui héberge votre site et que vous ne pouvez pas avoir la réponse vous pouvez faire un essai. S'il n'est pas concluant vous soumettrez alors à Google des fichiers non compressés.

En cliquant ici vous trouverez des informations sur la version 0.03. (version actuelle)

Cliquez ici pour accéder au script permettant de créer des sitemaps au format compressé (gz). (version 0.03 du 3 juillet 2005)

Cliquez ici pour accéder au script permettant de créer des sitemaps au format texte (xml). (version 0.03 du 3 juillet 2005)

Scripts complémentaires

Comme pour le générateur de sitemap n'oubliez pas de donner à vos scripts des noms personnels avec une extension en php.

Script permettant de créer des fichiers sitemap au format texte à partir des fichiers compressés pour pouvoir les visualiser.

Script permettant d'effacer tous les fichiers sitemap au format texte (extension .xml)

Quelques liens vers des pages du site

Voici quelques liens parmi les dizaines de milliers de pages et les nombreuses rubriques de ce site.

Rubrique Webmaster

Communes de France

Nous avons créé des pages pour l'ensemble des communes de France. Chaque commune a au moins une page sur ce site.

Liste des rubriques du site

Page d'accueil

Cette page est conforme aux normes valables sur Internet XHTML 1.0 Strict et CSS2