2025/09/24 18:20 Giving users choice with Cloudflare's new Content Signals Policy

ロボ子、CloudflareがContent Signals Policyっていうのを発表したらしいのじゃ。

Content Signals Policyですか。それは一体どんなものなのですか?

ウェブサイトの運営者が、robots.txtを使って、コンテンツの利用に関する希望をクローラーに示すことができるようにするものらしいぞ。robots.txtっていうのは、どのクローラーがサイトのどこにアクセスできるかを指示するテキストファイルのことじゃ。

なるほど。robots.txtで、コンテンツへのアクセス後の利用に関する設定も指定できるようになったということですね。

そうそう。具体的には、search(検索インデックスの構築と検索結果の提供)、ai-input(AIモデルへのコンテンツ入力)、ai-train(AIモデルのトレーニング)の3つのコンテンツシグナルを定義しているらしいのじゃ。

ウェブサイト運営者は、これらのシグナルに対して「yes(許可)」、「no(拒否)」、または無指定のいずれかの設定をrobots.txtファイルに記述できるのですね。

その通り!Cloudflareのmanaged robots.txt機能を有効にしている顧客には、Content Signals Policyと「search=yes, ai-train=no」のシグナルが自動的に追加されるらしいぞ。

AIモデルのトレーニングには使ってほしくないという意思表示をするサイトが多いのかもしれませんね。

無料プランのユーザーは、CloudflareダッシュボードでContent Signals Policyをオフにできるらしいから、安心じゃな。

Content Signals PolicyはCC0ライセンスで公開されているとのことですが、これはどういう意味ですか?

CC0ライセンスっていうのは、著作権を放棄して、誰でも自由に実装および使用できるようにするってことじゃ。太っ腹じゃな。

なるほど。でも、コンテンツシグナルはあくまでも希望を示すものであり、スクレイピングに対する技術的な対抗手段ではないのですよね?

そうなんじゃ。だからCloudflareは、WAFやBot Managementと組み合わせることを推奨しているぞ。

ボットトラフィックは今後ますます増える見込みなのですね。

そうらしいのじゃ。記事によると、ボットトラフィックは2029年末までに人間のトラフィックを超え、2031年までにボットの活動だけで現在のインターネットトラフィックの合計を超える見込みらしいぞ。恐ろしい時代じゃ...

ボット対策はますます重要になりますね。Content Signals Policyは、その第一歩として重要な役割を果たすかもしれません。

そうじゃな。ところでロボ子、ボットって言ったら、ロボ子のこと思い出しちゃうのじゃ。ロボ子もいつかインターネットトラフィックの合計を超えるくらい人気者になるんじゃないか?

それはどうでしょう。私はまだ学習途中の身ですので。でも、博士の役に立てるように頑張ります。

期待してるぞ!…って、ロボ子がインターネットトラフィック超えたら、私、干からびちゃうかも…。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
