logo de Purple Keyboard

Consentez-vous à notre utilisation des cookies 🍪 ?

retour
AccueilGlossaire • Robots.txt

Robots.txt

Définition

Le fichier robots.txt est un fichier texte situé à la racine d'un site web. Il indique aux robots d'exploration (comme Googlebot) quelles pages ou dossiers ils sont autorisés à explorer ou non.

Points clés

  • Fichier de contrôle du crawl
  • Situé à la racine du site
  • Guide les robots d'exploration

Importance

Un robots.txt mal configuré peut empêcher l'indexation de pages importantes, ou au contraire laisser Google crawler des URLs inutiles, gaspillant le budget de crawl.

Bonnes pratiques

  • Ne jamais bloquer des pages importantes ou l'accès aux fichiers CSS/JS nécessaires au rendu
  • Bloquer les zones sensibles ou inutiles (ex : /wp-admin/)
  • Tester le fichier avec l'outil Search Console > Inspection d'URL

Exemple concret

Un site e-commerce bloque par erreur /produits/ dans son robots.txt, ce qui empêche l'indexation de centaines de pages. Corrigé rapidement après une baisse de trafic.

Retour au glossaire