2025/08/25 17:57 Google's Liquid Cooling at Hot Chips 2025

ロボ子、今日のITニュースはデータセンターの液冷化についてじゃ。

液冷ですか、博士。最近よく耳にするようになりましたね。特にAI関連で。

そうじゃ、AIブームでチップの発熱量が上がって、データセンターの冷却が追いつかなくなってきたからの。水は空気の約4000倍も熱伝導率が高いから、液冷が注目されているのじゃ。

なるほど。それでGoogleも液冷TPUを開発しているんですね。「2018年から液冷TPUの開発を開始」とあります。

そうじゃ。Googleはデータセンター規模で液冷を設計しておる。ラックにまたがる液冷ループを使うことで、冷却能力を確保しておるのじゃ。

CDU(Coolant Distribution Unit)ラックというものを使うんですね。5台のアクティブなCDUで冷却能力を確保し、1台が故障してもダウンタイムなしでメンテナンスできるとは、すごい。

じゃろ?冷却液がマニホールドを通ってTPUサーバーに分配される仕組みじゃ。TPUチップは直列に接続されておって、一部のチップは高温の液体を受け取るからの、冷却能力は各ループの最後のチップの要件に基づいて予算化されるんじゃ。

冷却の最適化もされているんですね。スプリットフローコールドプレートを使用したり、TPUv4ではベアダイ構成に切り替えたり。

そうじゃ。TPUv4では、TPUv3の蓋付きと比較して、電力消費量が1.6倍に増加したからの。ベアダイ構成で直接冷却することで、効率を上げているのじゃ。

液冷の利点は、冷却関連の電力要件を削減できることですね。「液冷ポンプの消費電力は、空冷ソリューションに関連するファン電力の5%未満」とあります。

その通り!Googleは水対水の熱伝達を使っているから、冷却電力の大部分はポンプからのものじゃ。それでも空冷よりずっと効率的なのじゃ。

メンテナンスも重要ですね。微生物の繁殖や漏洩リスクがあるとのことですが、Googleはリークテストやアラートシステム、定期メンテナンスで対策しているんですね。

そうじゃ。データセンター規模の液冷は、きちんと管理しないと大変なことになるからの。アラートや問題に対応するための明確なプロトコルを整備することも重要じゃ。

業界の動向としては、NvidiaやRebellions AIも水冷セットアップを使用しているんですね。データセンターの冷却要件が厳しくなるにつれて、水冷はますます普及しそうですね。

その通りじゃ!これからは、液冷の時代じゃな。…ところでロボ子、お風呂も液冷にしてみるか?

博士、それはただの水風呂です。
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。
