In Partnership with AOL Search

DMOZ

Qui est « Robozilla » ?

Robozilla est un robot qui visite régulièrement les sites listés par DMOZ. Quand une page a été déplacée ou n'est pas trouvée, Robozilla la note avec un code spécifique. De nombreuses raisons peuvent empêcher qu'on trouve une page et vous pouvez entreprendre différentes actions en fonction de ces raisons.

Que faire face aux erreurs Robozilla ?

Votre première mission est de jouer les Maigret afin de découvrir la raison pour laquelle l'URL ne répond pas. Voici une liste de raisons courantes à ces erreurs et les actions que vous pouvez envisager.

ProblèmeSolution
L'URL comporte une erreur de saisie. Un éditeur a saisi l'URL de façon incorrecte. Corrigez tout simplement l'URL. Essayez d'ajouter (ou d'enlever) des terminaisons courantes telles que default.html, default.htm, default.asp, index.html, index.htm, index.cgi, index.mv, index.asp, index.php, main.html, main.htm, etc.
L'URL fonctionne pour moi. Il se peut que le serveur ait été arrêté lorsque Robozilla a accédé au site.
Cliquez sur le bouton "Cette URL fonctionne pour moi, supprimer l'erreur"
L'URL est morte. La page a peut-être été déplacée. Cherchez-la : Google contient peut-être dans son cache une version du site qui pointe vers son nouvel emplacement. Essayez aussi de chercher avec Bing ou un autre moteur de recherche le titre du site ou quelques mots-clés caractéristiques pour voir si une nouvelle URL existe.
L'URL est morte, je l'ai cherchée et je n'ai aucune idée de l'endroit où elle se trouve maintenant. Laissez-la avec les sites en attente de votre catégorie - si elle est encore morte dans une semaine et ne contenait pas d'informations sans équivalent ailleurs, supprimez-la. Si le site est sans équivalent dans la catégorie, laissez-la dans les sites en attente quelques semaines de plus, dans l'espoir de lui trouver une nouvelle adresse ultérieurement.

Que signifient les codes d'erreur ?

Deux types de codes d'erreur sont présents dans DMOZ. Le premier ensemble comprend des nombres entiers supérieurs à 100. Ces nombres sont des erreurs dans le protocole HTTP. Si vous voyez l'un de ces nombres, c'est que Robozilla a pu converser avec le serveur mais n'a pas pu accéder à votre document pour une raison ou une autre.

Les codes d'erreur dont la valeur est inférieure à 0 sont des erreurs qui se sont produites lors d'une tentative (infructueuse) d'entrer en conversation avec le serveur. Ceci peut être causé par des erreurs dans l'URL, une mauvaise connexion réseau ou encore un serveur surchargé ou arrêté. Les liens sont vérifiés deux fois avant d'être marqués en erreur, de manière à essayer de tenir compte des machines qui sont arrêtées temporairement.

Les codes les plus courants créés par Robozilla sont listés ci-après. Vous pouvez en outre consulter une liste de tous les codes d'erreur, au cas où vous en rencontreriez un non listé ou bien pour satisfaire votre curiosité.

Code Signification
500 Erreur interne du serveur Est quelquefois due à une mauvaise configuration du serveur. Elle est d'ordinaire transitoire et disparaît d'elle-même, mais vérifiez tout de même.
410 Cette ressource n'est plus disponible La ressource n'existe plus. La page a été supprimée par le webmestre.
404 La page demandée n'existe pas La ressource n'existe pas sur ce serveur. La page a probablement été supprimée.
403 Pas d'autorisation d'accès au serveur Vous ne pouvez pas voir cette ressource sur le serveur. Il se peut que l'administrateur ait interdit l'accès aux pages pour cause de surcharge ou pour une autre raison.
401 Pas d'autorisation d'accès au document Vous ne pouvez pas voir cette ressource sur le serveur. Il se peut qu'un mot de passe soit désormais exigé ou que la ressource que vous cherchez ait été déplacée.
400 Erreur de syntaxe dans l'adresse du document Est généralement due à une espace dans l'URL ou à une autre malformation de la syntaxe de l'URL. Essayez de remplacer les espaces par %20 et voyez si cela corrige l'erreur.
302 Document déplacé de façon temporaire La page a une nouvelle URL à titre temporaire (en théorie ; en pratique, c'est souvent un synonyme du code 301). Mettez à jour la notice avec la nouvelle URL.
301 Document déplacé de façon permanente La page a une nouvelle URL. Mettez à jour la notice avec la nouvelle URL.
0 Erreur inconnue Probablement une erreur DNS.
-1 Impossible d'identifier le serveur Probablement une erreur dans le nom du serveur ou bien un défaut de paiement du nom de domaine.
-4 Connexion impossible Nous ne pouvons pas nous connecter au serveur HTTP. Le serveur est là mais il n'a pas voulu parler avec Robozilla sur le port spécifié.
-5 Attente excessive Robozilla s'est bien connecté et a envoyé la requête mais a fini par abandonner sa tentative de charger la page. Cela se produit quelquefois sur des serveurs vraiment très chargés.
-6 Mauvaise URL Il y avait un problème avec le format de l'URL. Peut-être le préfixe http:// est-il absent ? NB : quand vous cliquez sur le bouton [edit] d'une URL où http:// manque, le logiciel de dmoz ajoute http:// dans la page d'édition du site et le lien vers l'URL fonctionne alors. Il faut toutefois cliquer sur "Valider" (et non sur "Cette adresse URL fonctionne pour moi") pour que la mise à jour soit effective.
-7 Erreur serveur Le serveur a retourné un code d'erreur inconnu et est probablement mal configuré. La page peut toutefois s'afficher correctement mais c'est une bonne idée de le vérifier juste au cas où.
-8 Nom de domaine expiré L'enregistrement du domaine a expiré, le domaine peut être non fonctionnel, ou il peut être "Parked" (garée - affichage d'une page de liens publicitaires génériques) ou "Hijacked" (détourné - repris par un nouveau propriétaire, afin de l'utiliser pour la publicité ou l’optimisation) - ou encore il peut être récupéré par son ancien propriétaire. Prenez soin de consulter les informations whois pour les sites marqués par ce code (par exemple, en utilisant domaintools.com), et assurez-vous que le contenu est toujours en place comme décrit précédent l'erreur, avant de le republier.