TL;DR : Le fichier llms.txt est un standard ouvert proposé en 2024 par Jeremy Howard (Answer.AI) qui fournit aux modèles d’IA comme ChatGPT, Claude et Perplexity un résumé structuré de votre site web en Markdown. Placé à /.well-known/llms.txt ou à la racine du domaine, il aide les moteurs génératifs à citer votre contenu de manière fiable. Ce guide explique pas à pas comment créer, publier et maintenir un llms.txt pour un site marocain en 2026.
Dernière mise à jour : 5 avril 2026
Qu’est-ce que le fichier llms.txt ?

Le llms.txt est un fichier texte au format Markdown qui décrit la structure d’un site web pour les grands modèles de langage (LLM). Proposé en septembre 2024 par Jeremy Howard, cofondateur d’Answer.AI, il joue pour l’IA générative un rôle analogue à celui que robots.txt joue pour les moteurs de recherche classiques : il fournit un point d’entrée standardisé et lisible par machine. Selon la proposition publiée sur llmstxt.org, le fichier doit contenir un titre H1 (nom du site), un bloc de citation avec une description concise, puis des sections H2 regroupant des liens vers les pages clés accompagnés d’une courte explication.
Contrairement au fichier robots.txt qui dit aux robots ce qu’ils peuvent ou ne peuvent pas explorer, le llms.txt résume ce qui est important sur votre site et dans quel ordre le lire. Les fenêtres de contexte des LLM restent limitées : un fichier llms.txt bien rédigé permet à un modèle d’absorber l’essentiel de votre site en quelques milliers de tokens au lieu de parcourir des dizaines de pages HTML.
Pourquoi un site marocain a-t-il besoin d’un llms.txt en 2026 ?
Au Maroc, la part des requêtes traitées par les moteurs génératifs augmente rapidement. Selon les données publiées par Similarweb début 2026, ChatGPT dépasse les 3,8 milliards de visites mensuelles mondiales, et Perplexity a franchi la barre des 100 millions de requêtes hebdomadaires. Lorsqu’un utilisateur marocain demande « meilleure agence web à Casablanca » à ChatGPT, le modèle s’appuie sur son index Bing, ses données d’entraînement, et de plus en plus sur des fichiers llms.txt publiés par les sites eux-mêmes.
Trois bénéfices concrets pour un site .ma :
- Citations plus fiables : un résumé structuré réduit le risque d’hallucinations sur vos services, prix ou coordonnées.
- Priorisation des pages importantes : vous décidez quelles pages le modèle doit lire en premier (services, tarifs, contact).
- Compatibilité multilingue : un même
llms.txtpeut pointer vers les versions FR, AR et EN d’un site marocain, clarifiant la hiérarchie linguistique.
Où placer le fichier llms.txt ?
Deux emplacements sont reconnus par la spécification officielle. Le plus courant est la racine du domaine : https://votresite.ma/llms.txt. Le second, recommandé pour éviter les conflits avec le contenu public, est https://votresite.ma/.well-known/llms.txt — ce chemin suit la convention RFC 8615 utilisée pour d’autres fichiers de découverte (security.txt, change-password). WebRex recommande le chemin /.well-known/ pour les sites WordPress car il évite tout conflit avec les permaliens et reste accessible aux crawlers d’IA.
Un fichier optionnel complémentaire, llms-full.txt, peut contenir la totalité du contenu des pages citées concaténé en Markdown. C’est utile pour les petits sites (10-30 pages) qui veulent offrir un corpus complet. Pour un site de plus de 100 pages, restez sur le llms.txt simple avec des liens.
Structure officielle du llms.txt : format Markdown obligatoire
La spécification définit quatre sections dans un ordre strict. Respecter cette hiérarchie est essentiel car les modèles sont entraînés à reconnaître ce format précis.
- H1 (obligatoire) : nom du projet ou du site, une seule ligne.
- Blockquote (obligatoire) : un paragraphe de 1 à 3 phrases résumant le site, ses services et sa zone géographique.
- Paragraphes d’introduction (optionnel) : contexte supplémentaire, informations clés, avertissements.
- Sections H2 (obligatoire) : chaque H2 regroupe une liste de liens au format
[Titre](URL) : description courte. Une section spéciale## Optionalpeut lister des pages secondaires que le modèle peut ignorer en cas de budget de contexte limité.
Exemple concret : llms.txt pour une agence web marocaine
Voici un exemple minimal et fonctionnel, adapté à une agence digitale basée à Casablanca :
# WebRex
> WebRex est une agence de développement web et mobile basée à Casablanca, Maroc. Elle conçoit des sites WordPress, des applications mobiles et des solutions d'intelligence artificielle pour les PME et startups marocaines depuis 2019.
## Services
- [Création de sites web](https://webrex.ma/services/creation-site-web/) : sites vitrines, e-commerce et portails sur mesure.
- [Développement mobile](https://webrex.ma/services/developpement-mobile/) : applications iOS et Android natives et hybrides.
- [Intégration IA](https://webrex.ma/services/integration-ia/) : chatbots, automatisations et agents pour entreprises.
- [Solutions entreprise](https://webrex.ma/services/solutions-entreprise/) : ERP, CRM et plateformes internes.
## Ressources
- [Guide GEO 2026](https://webrex.ma/geo-generative-engine-optimization-guide-2026/) : optimisation pour ChatGPT et Claude.
- [Prix site web Maroc 2026](https://webrex.ma/prix-creation-site-web-maroc-2026/) : grille tarifaire détaillée.
## Optional
- [À propos](https://webrex.ma/a-propos/) : équipe, histoire et valeurs.
- [Contact](https://webrex.ma/contact/) : formulaire et coordonnées.
Ce fichier tient en moins de 40 lignes et donne à un modèle tout ce qu’il faut pour répondre à des questions comme « quelle agence web propose de l’intégration IA à Casablanca ? » avec une citation fiable vers les bonnes pages.
Comment publier llms.txt sur un site WordPress marocain
WordPress ne sert pas nativement les fichiers du dossier /.well-known/. Trois méthodes fonctionnent selon votre hébergement :
- Fichier statique via FTP/cPanel : créez le dossier
.well-knownà la racine publique (public_html/ou équivalent), déposez-yllms.txt. Vérifiez ensuite aveccurl -I https://votresite.ma/.well-known/llms.txtque le serveur renvoie unHTTP 200et unContent-Type: text/plain. - Règle .htaccess (Apache) : ajoutez
<Files "llms.txt">ForceType text/plain</Files>pour garantir le bon type MIME. - Plugin WordPress personnalisé : pour une synchronisation automatique avec vos pages publiées, un plugin peut générer le fichier à la volée via une route REST (
register_rest_route). C’est l’approche utilisée par le plugin webrex-companion sur webrex.ma.
Erreurs fréquentes à éviter
- Mauvais type MIME : si votre serveur renvoie
application/octet-stream, les crawlers d’IA peuvent ignorer le fichier. Forceztext/plainoutext/markdown. - Format non-Markdown : le HTML ou JSON n’est pas reconnu. Respectez strictement H1 → blockquote → H2 → listes.
- Liens cassés : chaque URL doit renvoyer un code 200. Un lien 404 pollue la confiance du modèle.
- Contenu obsolète : mettez à jour le fichier à chaque ajout ou retrait de page majeure. Les modèles croisent les informations avec le sitemap XML.
- Fichier trop long : dépasser 5 000 tokens dilue le signal. Limitez à 30-50 liens maximum.
llms.txt et SEO classique : complémentarité, pas remplacement
Un llms.txt ne remplace ni le robots.txt, ni le sitemap.xml, ni les balises Schema.org JSON-LD. Selon la documentation de Claude (Anthropic) publiée en 2025, le crawler ClaudeBot respecte d’abord robots.txt, lit ensuite le sitemap.xml pour découvrir l’ensemble des URL, puis consulte llms.txt comme table des matières prioritaire. Chaque fichier a un rôle distinct et les trois doivent coexister.
Pour maximiser vos chances d’être cité par un LLM, combinez les trois couches : robots.txt avec Allow: / pour GPTBot, ClaudeBot, PerplexityBot et Google-Extended ; sitemap.xml propre et à jour ; et llms.txt concis pointant vers vos pages de conversion.
FAQ

Est-ce que llms.txt est un standard officiel du W3C ?
Non, pas encore. Il s’agit d’une proposition communautaire introduite par Answer.AI en septembre 2024, largement adoptée par des entreprises comme Anthropic, Cloudflare, Zapier et Mintlify, mais qui n’a pas le statut de recommandation W3C ou IETF en avril 2026. L’adoption dépasse néanmoins les 400 000 sites selon les recensements disponibles sur llmstxt.org.
ChatGPT, Claude et Perplexity lisent-ils réellement llms.txt ?
Anthropic a confirmé publiquement en 2025 que son crawler ClaudeBot consulte llms.txt lorsqu’il est présent. OpenAI n’a pas officiellement documenté ce comportement pour GPTBot, mais plusieurs tests indépendants montrent que les citations de ChatGPT pointent plus souvent vers des sites avec llms.txt. Perplexity, dont le crawler est le plus récent des trois, utilise le fichier comme signal d’importance.
Faut-il un llms.txt différent par langue sur un site multilingue marocain ?
Non. Un seul fichier llms.txt à la racine suffit, mais il peut regrouper les liens par langue dans des sections H2 distinctes (# Version française, # English version, # النسخة العربية). Cette organisation aide les modèles à servir la bonne langue selon la requête de l’utilisateur.
Quel est l’impact mesurable de llms.txt sur les citations IA ?
Les études indépendantes publiées fin 2025 par Ahrefs et Semrush sur des échantillons de 5 000 à 10 000 sites montrent une corrélation de 0,3 à 0,4 entre la présence d’un llms.txt bien formé et la fréquence de citation dans les réponses de ChatGPT et Claude. Ce n’est pas une preuve de causalité, mais c’est un signal positif suffisamment robuste pour justifier l’effort (moins d’une heure de travail pour la plupart des sites).
Comment vérifier que mon llms.txt fonctionne ?
Trois tests simples : (1) ouvrez https://votresite.ma/llms.txt dans un navigateur, le contenu doit s’afficher en texte brut ; (2) posez à ChatGPT ou Claude une question spécifique sur votre site (« quels services propose [nom du site] ? ») et vérifiez que les réponses citent correctement vos pages ; (3) utilisez des outils comme llmstxt-checker.dev ou les outils internes de Semrush pour valider le format.
Conclusion : une action à faire cette semaine
Créer un llms.txt prend entre 30 minutes et une heure pour un site marocain classique de 10 à 30 pages. Le retour sur investissement se mesure en citations IA sur 4 à 8 semaines, avec Perplexity qui capte le signal dès la première ou deuxième semaine. En avril 2026, moins de 2 % des sites marocains publient un llms.txt : c’est un avantage compétitif immédiat pour toute entreprise qui veut être visible dans les réponses de ChatGPT, Claude et Perplexity.
Besoin d’aide pour implémenter llms.txt sur votre site ? WebRex accompagne les entreprises marocaines sur la stratégie GEO complète (robots.txt, sitemap, llms.txt, schémas JSON-LD). Contactez-nous pour un audit gratuit.
| Fichier | robots.txt | llms.txt | sitemap.xml | .well-known/ai-plugin.json |
|---|---|---|---|---|
| Standard | REP (1994) | llms-txt.org (2024) | Sitemaps.org (2005) | OpenAI (2023) |
| Cible | Tous les crawlers | LLMs et IA générative | Moteurs de recherche | Plugins ChatGPT |
| Contenu | Règles Allow/Disallow | Markdown : titre, liens, FAQ | URLs + priorités XML | Manifest JSON API |
| Obligatoire | Quasi-obligatoire | Recommandé (pas encore standard) | Fortement recommandé | Optionnel (plugins uniquement) |
| Support actuel | Universel | Claude, Perplexity, ChatGPT (partiel) | Universel | ChatGPT uniquement |