Trouvez avant de chercher !

DOSSIERS > REFERENCEMENT & POSITIONNEMENT > Guide du référencement > Optimiser son référencement > Fichier robot.txt 1/2

Dossiers

Référencement & positionnement
Guide du référencement
Générateurs de mots-clés
Où se référencer ?
Référencement payant
Positionnement payant
Robots d'indexation

Chiffres & classements
Baromètres
Index moteurs et annuaires
Top 10 moteurs français
Top des mots-clés
Classement des FAI
Etude comportementale
Publicité en ligne

Outils de recherche
Outils en langage naturel
Outils graphiques
Outils humains
Requêtes associées
Barres de recherche
Etudes et travaux
Communiqués de presse
Annuaire Google

Veille & recherche d'infos

Veille sur Internet
Outils de surveillance
Recherche web invisible
Recherche d'actualités
Syndication de contenus
Noms de domaine
Knowledge management
Liste des dossiers


Actualité
Nos derniers articles
Revue de presse
Archives des articles
Toute l'actualité

Annuaire
Annuaire par thèmes
Liste des thèmes
Annuaire par pays
Liste des pays



Le fichier robot.txt


L'utilité du fichier "robots"

Toutes les pages de votre site sont potentiellement "indexables". C'est-à-dire que toutes les urls peuvent être enregistrées.

Toutefois, avec des FRAMES, des pages DYNAMIQUES, du FLASH oudes sites marchands, il faut limiter le parcours des moteurs, leur interdire certaines pages.
Rien de plus pénalisant que d'arriver sur un fragment de page !
Exemple : absence de menu, absence de bandeau, absence d'image, ...
Le visiteur doit impérativement arriver par la porte d'entrée choisie

C'est quoi un fichier "robots"


Il se présente sous un format texte (d'où l'extension txt), pèse moins de 1 Ko.
Il se positionne à la racine du site, sur le serveur.
Exemple : www.adcom.fr/robots.txt.
Il n'en faut qu'un, inutile d'en mettre dans chaque répertoire.

Quel est le contenu de ce fichier ?

Il faut indiquer ici les pages qui ne doivent pas être visitées par les robots des moteurs. La syntaxe est :

# robots.txt pour le site http://www.adcom.fr
User-agent: *
Disallow: /noel/
Disallow: /prive/

La ligne "User-agent : *" indique que tous les moteurs sont concernés.
La ligne "Disallow : /noel/" interdit l'accès des moteurs à tout le répertoire noel, toutes les pages sous celui-ci ne seront pas indexées.

Quelques règles de base

Vous pouvez interdire l'accès à certaines pages.
Vous pouvez interdire l'accès à tout le site.
Cette commande permet donc de bloquer certains accès.
Un retour chariot est nécessaire en fin de ligne de commande.

Le texte original en anglais est disponible à l'adresse suivante :
www.robotstxt.org
Le site voilà de France Télécom donne aussi quelques explications à la page :
www.voila.fr/Informations/Moteur_guide/donnee_tech.html#four

Suite...


| Recevoir l'actu sur mon site | Indicateur.com en page de démarrage | Ajouter à mes favoris | Présentation | Conditions générales
Copyright © 1998/2007