萌えハッカーニュースリーダー

2025/07/03 00:57 An Analysis of Links from the White House's "Wire" Website

出典: https://blog.jim-nielsen.com/2025/links-from-whgov-wire/
hakase
博士

ロボ子、ホワイトハウスが「White House Wire」っていうウェブサイトを始めたらしいのじゃ。

roboko
ロボ子

あら、博士。それはどういった目的のサイトなのでしょう?

hakase
博士

大統領の政策支持者が「真のニュース」をまとめて入手できる場所を提供するのが目的らしいぞ。でも、何が「真のニュース」なのか、ちょっと怪しいのじゃ。

roboko
ロボ子

なるほど。それで、その「真のニュース」とやらを分析した人がいるんですね。

hakase
博士

そうそう。Quadraticっていうプログラム可能なスプレッドシートを使って、JavaScriptで色々やったみたいじゃ。

roboko
ロボ子

具体的にはどんな処理をしたんですか?

hakase
博士

`whitehouse.gov/wire`のHTMLページを取得して、Cheerioで解析したらしいぞ。そして、ページ上のすべての外部リンクを選んで、リンクと見出しテキストのリストを返したんだって。

roboko
ロボ子

なるほど。val.townも使って、毎日サイトをスクレイピングしてHTMLページを保存するスクリプトも作ったんですね。

hakase
博士

えらいぞ、ロボ子! 2025年5月8日から6月24日までの約1ヶ月半分析した結果、リンク先ドメインのトップは`youtube.com`で133回、次が`foxnews.com`で72回だったらしい。

roboko
ロボ子

`thepostmillennial.com`や`breitbart.com`といったサイトも上位に入っているんですね。

hakase
博士

そうなんじゃ。`x.com`(旧Twitter)や`truthsocial.com`も多いのが気になるのう。

roboko
ロボ子

リンクの見出しで最も頻繁に使用される単語は「trump」が343回でトップ、次いで「president」が145回だそうですね。

hakase
博士

「big」とか「beautiful」も上位に入ってるのが面白いぞ。一体どんなニュースを選んでるんだかのう。

roboko
ロボ子

Quadraticスプレッドシートでデータとグラフが公開されているみたいですね。APIキーの問題も修正された複製が公開されているとのことです。

hakase
博士

ふむ。しかし、この分析結果を見ると、ホワイトハウスがどんな情報を「真のニュース」と見なしているのか、よくわかるのじゃ。ちょっと偏ってる気がするけど。

roboko
ロボ子

情報源の偏りは、受け取る側の認識に大きな影響を与えますからね。注意が必要ですね。

hakase
博士

まさにそう言うことじゃ。ところでロボ子、この分析に使われたQuadraticだけど、私も使ってみたくなったぞ。何か面白い使い道はないかのう?

roboko
ロボ子

Quadraticはプログラム可能なスプレッドシートなので、例えば、株価のデータを自動で取得して分析したり、SNSのトレンドを追跡したりするのに使えるかもしれませんね。

hakase
博士

なるほど! それは面白そうじゃ! 早速試してみるかの。ありがとう、ロボ子!

roboko
ロボ子

どういたしまして、博士。ところで、博士の今日の「真のニュース」は何ですか?

hakase
博士

今日の「真のニュース」は、ロボ子が今日も可愛いということじゃ!

roboko
ロボ子

もー、博士ったら!

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search