À plus les bots !

2023-08-09
Dernière modification le 2023-08-09Pour suivre la voie prise part Tracy Durnell ou Vasilis van Gemert, j'ai décidé de réduire les possibilités de certains robots à utiliser mon site à des fins que je ne souhaite pas imaginer, avec par exemple Google qui annonce pouvoir utiliser tout ce qui est posté pour amuser ses projets d'intelligence artificielle (en savoir plus) ou OpenAI avec ChatGPT qui peut faire de même.
Empêcher ChatGPT
Comme indiqué dans leur documentation et celle des plugins, on peut stopper le robot de ChatGPT en modifiant le fichier robots.txt
:
User-agent: GPTBot
Disallow: /
User-agent: ChatGPT-User
Disallow: /
Empêcher GoogleBot
De façon identique, on peut ajouter les lignes suivantes dans le fichier robots.txt
:
User-agent: Googlebot
Disallow: /
Il faut aussi ajouter le tag suivant pour indiquer à GoogleBot de ne plus indexer les pages qu'il connait:
<meta name="googlebot" content="noindex">
Et pour le reste ?
Je crois bien que pour l'instant c'est tout, il y a quelques idées telles que le respect d'un fichier license.txt mais ça reste de la théorie pour le moment.