Googleは会話型のAI・Geminiを提供しており、そのためにウェブ上のコンテンツを学習(トレーニング)に利用しています。
自身のウェブサイトがGoogleの生成AIモデルの学習に利用されないようにするには、robots.txtに以下を記述し、「Google-Extended」をブロックすればOKです。
User-agent: Google-Extended Disallow: /
この2行を記述すれば、自身のウェブサイトがGoogleの生成AIモデルの学習に利用されるのを防ぐことが可能です。
関連:ChatGPTのクローラーをブロックする方法はこちら
既に学習されたコンテンツは削除できない
今回紹介したのは、コンテンツがGoogleに新たに学習されるのを防ぐオプションであり、Googleに既に学習されたコンテンツを削除する事は不可能です。
Googleはこのオプションを発表する前から、ウェブ上のコンテンツを学習に利用していました。
その為、このオプションをrobots.txtに記述しても、既に自分のウェブサイトがGoogleに利用されている可能性がある点に注意しましょう。