Comment savoir si ChatGPT voit votre site web
Mis à jour — 9 min de lecture
Vous pouvez découvrir si ChatGPT voit votre site web en quelques minutes seulement en testant trois choses dans l'ordre : les robots d'IA peuvent-ils atteindre vos pages, peuvent-ils lire votre contenu, et peuvent-ils vous citer dans une réponse. Ces éléments correspondent aux trois points de défaillance qui rendent la plupart des sites invisibles aux moteurs d'IA : un robots.txt bloqué, un rendu uniquement en JavaScript, et un contenu mince ou enfoui. Ce guide vous présente six méthodes concrètes — d'un test curl en une seule ligne jusqu'à l'interrogation directe des moteurs d'IA — afin que vous puissiez cesser de deviner votre visibilité IA et commencer à corriger exactement ce qui ne va pas.
Si vous vous êtes déjà demandé « est-ce que mon site web est visible pour ChatGPT ? » ou « est-ce que ChatGPT peut lire mon site tout court ? », la bonne nouvelle, c'est que la visibilité IA est diagnosticable. Contrairement au SEO traditionnel, où le classement évolue lentement, vous pouvez inspecter directement ce qu'un robot d'IA reçoit lorsqu'il demande votre page et confirmer en temps réel si votre contenu est accessible, analysable et citable.
Pourquoi ChatGPT pourrait ne pas voir votre site
Avant de lancer le moindre test, il est utile de comprendre les trois raisons les plus courantes pour lesquelles un site reste invisible aux moteurs d'IA. Presque tous les cas de « pourquoi ChatGPT ne mentionne-t-il pas mon site web » se ramènent à l'une d'elles :
- Votre robots.txt bloque les robots d'IA. De nombreux sites — souvent par défaut dans un CMS ou via un module de sécurité — interdisent les robots comme
GPTBot. Si l'on dit au robot de ne pas récupérer vos pages, votre contenu n'entre jamais dans le pipeline d'entraînement ou de récupération. - Votre contenu ne s'affiche qu'avec JavaScript. Si votre page envoie une coquille HTML vide et construit le vrai contenu dans le navigateur à l'aide du rendu côté client, un robot qui lit le HTML brut peut ne voir qu'un
<div id="root">vide. - Votre contenu est mince, enfoui ou non structuré. Même lorsqu'un robot peut atteindre et lire votre page, il a besoin de passages clairs, autonomes et citables. Un mur de remplissage marketing sans réponses directes ne donne au modèle rien de concret à citer.
Méthode 1 : Vérifiez votre robots.txt
Votre fichier robots.txt est la première barrière. Il se trouve à la racine de votre domaine, vous pouvez donc le consulter instantanément en allant à https://votresite.com/robots.txt dans n'importe quel navigateur. Ce fichier en texte brut indique aux robots quels chemins ils peuvent ou ne peuvent pas récupérer — et cela inclut les user-agents d'IA.
Ouvrez le fichier et repérez toute règle Disallow liée aux robots d'IA, ou un blocage global qui attrape tout. Voici les user-agents qui comptent le plus pour la visibilité IA en 2026 :
Principaux user-agents de robots d'IA à repérer dans robots.txt
| User-agent | Opérateur | Ce qu'il fait |
|---|---|---|
| GPTBot | OpenAI | Explore les pages pour entraîner et améliorer les modèles d'OpenAI |
| ChatGPT-User | OpenAI | Récupère les pages en direct lorsqu'une requête d'un utilisateur déclenche une action de navigation |
| OAI-SearchBot | OpenAI | Indexe les pages pour les résultats de recherche et les citations de ChatGPT |
| PerplexityBot | Perplexity | Explore et indexe les pages pour les réponses de Perplexity |
| Google-Extended | Contrôle si le contenu est utilisé pour Gemini et les fonctionnalités d'IA |
Une ligne comme User-agent: GPTBot suivie de Disallow: / signifie que vous dites explicitement au robot de ChatGPT de rester hors de l'ensemble de votre site. De même, un User-agent: * global avec Disallow: / bloque tout le monde. Si vous voulez que l'IA voie votre site web, ni l'un ni l'autre ne devrait bloquer le contenu qui vous tient à cœur.
Méthode 2 : Testez ce qu'un robot reçoit réellement
Consulter votre site dans un navigateur vous indique ce qu'un humain voit. Pour savoir ce qu'un robot voit, vous devez demander la page en tant que ce robot. La façon la plus rapide de faire un test de user-agent avec curl se fait depuis votre terminal, en usurpant la chaîne de user-agent du robot pour que le serveur réponde exactement comme il le ferait à GPTBot.
# Request your homepage as GPTBot and read the raw HTML
curl -A "GPTBot" https://yoursite.com
# Save it to a file so you can search the response
curl -A "GPTBot" https://yoursite.com -o gptbot-view.html
# Follow redirects and show response headers too
curl -A "GPTBot" -IL https://yoursite.comLisez le résultat. Si votre titre, votre corps de texte et vos faits clés apparaissent dans ce HTML brut, un robot peut les lire — c'est ce que vous donne le rendu côté serveur. Si la réponse est une coquille presque vide avec quelques balises de script et aucun texte visible, le robot ne reçoit rien d'utile, et vous avez trouvé votre problème.
Afficher la source vs. le DOM rendu
Vous pouvez exécuter le même test dans un navigateur sans le terminal. Dans Chrome ou Firefox, faites un clic droit sur votre page et choisissez Afficher la source (ou appuyez sur Ctrl+U / Cmd+Option+U). Cela montre le HTML brut envoyé par le serveur — l'approximation la plus proche de ce qu'un simple robot ingère. Élément crucial, c'est différent du DOM rendu que vous voyez dans le panneau Elements de DevTools, qui montre la page après l'exécution du JavaScript. Les robots d'IA qui n'exécutent pas le JavaScript n'obtiennent que la version Afficher la source, c'est donc celle qui compte pour tester la visibilité dans ChatGPT.
Méthode 3 : Vérifiez si votre contenu nécessite du JavaScript
C'est la raison la plus courante pour laquelle un site moderne est invisible aux IA. De nombreuses applications React, Vue et Angular utilisent le rendu côté client (CSR) : le serveur envoie un document HTML minimal, et le navigateur télécharge le JavaScript qui récupère et construit le contenu ensuite. Les humains ne s'en aperçoivent jamais. Les robots qui lisent le HTML brut peuvent se retrouver sans rien.
Pour détecter le CSR, utilisez Afficher la source (méthode 2) et cherchez ces signes révélateurs :
- Un
<body>presque vide ne contenant guère plus que<div id="root"></div>ou<div id="app"></div>. - De grands blocs de balises
<script>mais aucun texte de paragraphe, titre ou contenu d'article visible dans la source. - Une réponse
curldont la taille n'est qu'une fraction de ce que vous voyez dans le navigateur. - Votre contenu principal apparaissant dans le panneau Elements de DevTools mais totalement absent de la source affichée.
Si vous observez ces motifs, votre réponse à « est-ce que ChatGPT peut lire mon site » est probablement non. La solution consiste à effectuer le rendu du contenu sur le serveur. Les options incluent le rendu côté serveur (SSR), la génération de site statique (SSG) ou le prérendu, qui livrent tous du vrai HTML dans la réponse initiale. Des frameworks comme Next.js, Nuxt, Astro et SvelteKit le font d'emblée.
Méthode 4 : Recherchez des données structurées
Les données structurées ne rendront pas lisible une page illisible, mais elles améliorent considérablement la confiance avec laquelle les moteurs d'IA comprennent et citent une page à laquelle ils peuvent déjà accéder. Le format dominant est le JSON-LD, intégré dans une balise de script. Pour vérifier si l'IA peut voir les données structurées de votre site web, ouvrez Afficher la source et cherchez (Ctrl+F) :
application/ld+jsonSi vous trouvez un ou plusieurs blocs <script type="application/ld+json">, votre page déclare des faits lisibles par machine — des éléments comme l'auteur et la date de l'article, le prix d'un produit, des paires de FAQ, les détails de l'organisation ou un fil d'Ariane. Les moteurs d'IA et les AI Overviews de Google utilisent ces signaux pour lever l'ambiguïté sur les entités et extraire des réponses précises. Si vous ne trouvez rien, ajouter le schéma pertinent (Article, FAQPage, Organization, Product) est une amélioration à fort effet de levier. Validez-le avec le test des résultats enrichis de Google ou le Schema Markup Validator.
Méthode 5 : Interrogez directement les moteurs d'IA
La façon la plus directe de répondre à « est-ce que mon site web est visible pour ChatGPT » est d'interroger les moteurs eux-mêmes. Cela teste le dernier maillon : peuvent-ils réellement vous citer ? Lancez des requêtes ciblées dans chaque grand moteur et observez si votre site apparaît comme source ou est nommé dans la réponse.
- ChatGPT (avec la recherche activée) : Posez une question à laquelle votre page devrait répondre, comme « Que propose [votre marque] ? » ou « Meilleurs outils [votre sujet] — inclure les sources. » Vérifiez si votre domaine apparaît comme lien cité.
- Perplexity : Perplexity affiche toujours des citations numérotées, ce qui en fait l'endroit le plus facile pour confirmer la visibilité. Cherchez le nom de votre marque accompagné d'un sujet et repérez votre URL dans la liste des sources.
- Google Gemini / AI Overviews : Lancez une requête informationnelle dans votre niche et voyez si votre contenu est résumé ou lié dans la réponse générée par l'IA.
Interprétez les résultats avec soin. Si un moteur vous cite, il peut clairement atteindre, lire et citer votre contenu — vous êtes en bonne posture. S'il décrit bien votre sujet mais ne vous mentionne jamais, votre contenu est probablement lisible mais pas assez distinctif ou citable. S'il se trompe sur des faits de base à propos de votre marque ou ne vous trouve pas du tout, cela renvoie à un blocage d'exploration ou de rendu que vous devriez diagnostiquer avec les méthodes 1 à 3.
Méthode 6 : Lancez une vérification GEO automatisée
Exécuter les cinq méthodes à la main est minutieux mais lent, et il est facile de passer à côté de quelque chose. Un outil automatisé peut récupérer votre page en tant que robot, analyser le HTML, inspecter votre robots.txt, détecter le rendu côté client et vérifier la présence de données structurées et de llms.txt en une seule passe — puis noter le résultat afin que vous sachiez où vous concentrer.
C'est exactement ce que fait un score GEO gratuit. Check GEO Score récupère votre page comme le ferait un robot d'IA et lui attribue une note de 0 à 100 selon quatre piliers de l'optimisation pour les moteurs génératifs : les robots peuvent-ils accéder à votre contenu, est-il structuré pour la lecture machine, est-il réellement répondable et citable, et votre site envoie-t-il des signaux de confiance clairs. C'est le moyen le plus rapide de transformer les vérifications manuelles ci-dessus en une liste de tâches priorisée.
Que faire si ChatGPT ne peut pas voir votre site
Si vos tests ont révélé un problème, parcourez cette liste de contrôle dans l'ordre. Elle est séquencée des blocages durs aux raffinements, alors corrigez les premiers éléments en priorité.
- 01Débloquez les robots d'IA dans robots.txt. Supprimez toute règle
DisallowciblantGPTBot,ChatGPT-User,OAI-SearchBotouPerplexityBot, sauf si vous avez une raison délibérée de les exclure. - 02Servez du vrai HTML. Si vous avez détecté un rendu côté client, basculez les pages qui comptent vers le rendu côté serveur, la génération statique ou le prérendu afin que le contenu apparaisse dans la réponse initiale.
- 03Confirmez la correction avec curl. Relancez
curl -A "GPTBot" https://yoursite.comet vérifiez que votre contenu réel apparaît désormais dans le HTML brut. - 04Ajoutez des données structurées. Implémentez le JSON-LD pour votre type de page (Article, FAQPage, Organization, Product) et validez-le.
- 05Rédigez des réponses citables et autonomes. Commencez les sections par des réponses directes, utilisez des titres clairs sous forme de questions, et incluez des faits, des définitions et des listes qu'un modèle peut reprendre proprement.
- 06Publiez un fichier llms.txt. Cette norme émergente offre aux moteurs d'IA une carte épurée et organisée de vos contenus les plus importants, en Markdown à
/llms.txt. - 07Assurez une base technique propre. Utilisez HTTPS, un sitemap valide, des temps de chargement rapides et des balises canoniques correctes pour que les robots puissent naviguer efficacement.
- 08Retestez avec les moteurs d'IA. Une fois les changements propagés, répétez la méthode 5 pour confirmer que vous êtes désormais lu et cité.
L'exploration et l'indexation prennent du temps, alors ne vous attendez pas à des citations instantanées après une correction. L'intérêt de ces tests est de supprimer chaque obstacle technique entre votre contenu et les moteurs d'IA — une fois qu'une page est accessible, lisible et citable, vos chances d'être mis en avant augmentent fortement.
Foire aux questions
Comment vérifier si ChatGPT peut voir mon site web ?+
Testez trois choses dans l'ordre. D'abord, ouvrez votre robots.txt et confirmez qu'il ne bloque pas GPTBot, ChatGPT-User ou OAI-SearchBot. Ensuite, lancez curl -A "GPTBot" https://yoursite.com et confirmez que votre contenu réel apparaît dans le HTML brut. Enfin, posez à ChatGPT (avec la recherche activée) une question à laquelle votre page devrait répondre et voyez s'il cite votre domaine. Si les trois passent, ChatGPT peut voir votre site.
Comment savoir si ChatGPT a indexé mon site ?+
ChatGPT n'expose pas d'index public comme le fait Google Search Console, il n'y a donc pas de statut « indexé » exact à consulter. Le test pratique consiste à activer la recherche dans ChatGPT et à le solliciter avec des questions de marque et de sujet. Si votre URL apparaît comme source citée, votre contenu a été exploré et est récupérable. Perplexity, qui liste toujours ses sources, est un endroit encore plus clair pour le confirmer.
Pourquoi ChatGPT ne mentionne-t-il pas mon site web ?+
Généralement pour l'une de ces trois raisons : votre robots.txt bloque le robot d'IA, votre contenu ne s'affiche qu'avec JavaScript de sorte que le robot reçoit une coquille vide, ou votre contenu est lisible mais trop mince ou générique pour valoir la peine d'être cité. Parcourez les méthodes 1 à 3 pour trouver le blocage, puis améliorez la citabilité de votre contenu.
Est-ce que ChatGPT explore mon site ?+
OpenAI exploite plusieurs robots : GPTBot pour l'entraînement des modèles, OAI-SearchBot pour l'indexation de recherche, et ChatGPT-User pour les récupérations en direct déclenchées par la requête d'un utilisateur. Qu'ils vous explorent dépend des autorisations de votre robots.txt et du fait que vos pages soient accessibles. Vous pouvez vérifier l'accès en cherchant ces user-agents dans les journaux de votre serveur ou en lançant le test curl.
Comment tester si l'IA peut lire ma page ?+
Utilisez Afficher la source (Ctrl+U ou Cmd+Option+U) dans votre navigateur, ou lancez un test de user-agent avec curl depuis le terminal. Si vos titres et votre corps de texte apparaissent dans ce HTML brut, les robots d'IA peuvent les lire. Si vous ne voyez qu'un <div id="root"> vide et des balises de script, votre contenu dépend du JavaScript et de nombreux robots d'IA ne le verront pas.
Bloquer GPTBot retire-t-il mon site de ChatGPT ?+
Non. Bloquer GPTBot dans robots.txt empêche l'exploration future à des fins d'entraînement, mais cela n'efface pas les connaissances que le modèle possède déjà, et cela n'empêche pas nécessairement ChatGPT-User de récupérer une page lors d'une navigation en direct. Si vous voulez une visibilité IA maximale, ne bloquez aucun des user-agents d'OpenAI.
Qu'est-ce qu'un score GEO et pourquoi est-ce important ?+
GEO signifie generative engine optimization (optimisation pour les moteurs génératifs) — la pratique consistant à rendre votre contenu visible pour les moteurs de réponse IA comme ChatGPT, Perplexity et Gemini. Un score GEO évalue dans quelle mesure une page y parvient, généralement selon l'accès, la structure, la capacité à répondre et la confiance. C'est important parce que cela consolide les vérifications manuelles de ce guide en un seul chiffre et une liste de corrections priorisée.
Le rendu côté serveur aidera-t-il l'IA à voir mon site ?+
Oui, de façon significative, si votre contenu repose actuellement sur le rendu côté client. Le rendu côté serveur, la génération statique et le prérendu livrent tous du HTML complet dans la réponse initiale, de sorte qu'un robot qui n'exécute pas le JavaScript reçoit tout de même l'intégralité de votre contenu. Après la bascule, confirmez le changement avec le test curl.
Qu'est-ce que llms.txt et en ai-je besoin ?+
llms.txt est une norme émergente : un fichier Markdown à la racine de votre domaine qui donne aux moteurs d'IA un aperçu épuré et organisé de vos pages les plus importantes. Il n'est pas encore universellement pris en charge et ne corrigera pas un site bloqué ou illisible, mais c'est un signal peu coûteux qui complète des fondations techniques solides et des données structurées.
Combien de temps avant que ChatGPT voie mon site après une correction ?+
Il n'y a pas de délai fixe. Les outils de récupération en direct comme ChatGPT-User et Perplexity peuvent capter les changements presque immédiatement lorsqu'une requête d'un utilisateur déclenche une récupération, tandis que les connaissances issues de l'entraînement se mettent à jour sur des cycles bien plus lents. L'approche fiable consiste à corriger les blocages techniques, puis à retester périodiquement avec les moteurs plutôt que d'attendre une date garantie.