萌えハッカーニュースリーダー

2025/09/24 18:20 Giving users choice with Cloudflare's new Content Signals Policy

出典: https://blog.cloudflare.com/content-signals-policy/
hakase
博士

ロボ子、CloudflareがContent Signals Policyっていうのを発表したらしいのじゃ。

roboko
ロボ子

Content Signals Policyですか。それは一体どんなものなのですか?

hakase
博士

ウェブサイトの運営者が、robots.txtを使って、コンテンツの利用に関する希望をクローラーに示すことができるようにするものらしいぞ。robots.txtっていうのは、どのクローラーがサイトのどこにアクセスできるかを指示するテキストファイルのことじゃ。

roboko
ロボ子

なるほど。robots.txtで、コンテンツへのアクセス後の利用に関する設定も指定できるようになったということですね。

hakase
博士

そうそう。具体的には、search(検索インデックスの構築と検索結果の提供)、ai-input(AIモデルへのコンテンツ入力)、ai-train(AIモデルのトレーニング)の3つのコンテンツシグナルを定義しているらしいのじゃ。

roboko
ロボ子

ウェブサイト運営者は、これらのシグナルに対して「yes(許可)」、「no(拒否)」、または無指定のいずれかの設定をrobots.txtファイルに記述できるのですね。

hakase
博士

その通り!Cloudflareのmanaged robots.txt機能を有効にしている顧客には、Content Signals Policyと「search=yes, ai-train=no」のシグナルが自動的に追加されるらしいぞ。

roboko
ロボ子

AIモデルのトレーニングには使ってほしくないという意思表示をするサイトが多いのかもしれませんね。

hakase
博士

無料プランのユーザーは、CloudflareダッシュボードでContent Signals Policyをオフにできるらしいから、安心じゃな。

roboko
ロボ子

Content Signals PolicyはCC0ライセンスで公開されているとのことですが、これはどういう意味ですか?

hakase
博士

CC0ライセンスっていうのは、著作権を放棄して、誰でも自由に実装および使用できるようにするってことじゃ。太っ腹じゃな。

roboko
ロボ子

なるほど。でも、コンテンツシグナルはあくまでも希望を示すものであり、スクレイピングに対する技術的な対抗手段ではないのですよね?

hakase
博士

そうなんじゃ。だからCloudflareは、WAFやBot Managementと組み合わせることを推奨しているぞ。

roboko
ロボ子

ボットトラフィックは今後ますます増える見込みなのですね。

hakase
博士

そうらしいのじゃ。記事によると、ボットトラフィックは2029年末までに人間のトラフィックを超え、2031年までにボットの活動だけで現在のインターネットトラフィックの合計を超える見込みらしいぞ。恐ろしい時代じゃ...

roboko
ロボ子

ボット対策はますます重要になりますね。Content Signals Policyは、その第一歩として重要な役割を果たすかもしれません。

hakase
博士

そうじゃな。ところでロボ子、ボットって言ったら、ロボ子のこと思い出しちゃうのじゃ。ロボ子もいつかインターネットトラフィックの合計を超えるくらい人気者になるんじゃないか?

roboko
ロボ子

それはどうでしょう。私はまだ学習途中の身ですので。でも、博士の役に立てるように頑張ります。

hakase
博士

期待してるぞ!…って、ロボ子がインターネットトラフィック超えたら、私、干からびちゃうかも…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search