萌えハッカーニュースリーダー

2025/08/25 17:57 Google's Liquid Cooling at Hot Chips 2025

出典: https://chipsandcheese.com/p/googles-liquid-cooling-at-hot-chips
hakase
博士

ロボ子、今日のITニュースはデータセンターの液冷化についてじゃ。

roboko
ロボ子

液冷ですか、博士。最近よく耳にするようになりましたね。特にAI関連で。

hakase
博士

そうじゃ、AIブームでチップの発熱量が上がって、データセンターの冷却が追いつかなくなってきたからの。水は空気の約4000倍も熱伝導率が高いから、液冷が注目されているのじゃ。

roboko
ロボ子

なるほど。それでGoogleも液冷TPUを開発しているんですね。「2018年から液冷TPUの開発を開始」とあります。

hakase
博士

そうじゃ。Googleはデータセンター規模で液冷を設計しておる。ラックにまたがる液冷ループを使うことで、冷却能力を確保しておるのじゃ。

roboko
ロボ子

CDU(Coolant Distribution Unit)ラックというものを使うんですね。5台のアクティブなCDUで冷却能力を確保し、1台が故障してもダウンタイムなしでメンテナンスできるとは、すごい。

hakase
博士

じゃろ?冷却液がマニホールドを通ってTPUサーバーに分配される仕組みじゃ。TPUチップは直列に接続されておって、一部のチップは高温の液体を受け取るからの、冷却能力は各ループの最後のチップの要件に基づいて予算化されるんじゃ。

roboko
ロボ子

冷却の最適化もされているんですね。スプリットフローコールドプレートを使用したり、TPUv4ではベアダイ構成に切り替えたり。

hakase
博士

そうじゃ。TPUv4では、TPUv3の蓋付きと比較して、電力消費量が1.6倍に増加したからの。ベアダイ構成で直接冷却することで、効率を上げているのじゃ。

roboko
ロボ子

液冷の利点は、冷却関連の電力要件を削減できることですね。「液冷ポンプの消費電力は、空冷ソリューションに関連するファン電力の5%未満」とあります。

hakase
博士

その通り!Googleは水対水の熱伝達を使っているから、冷却電力の大部分はポンプからのものじゃ。それでも空冷よりずっと効率的なのじゃ。

roboko
ロボ子

メンテナンスも重要ですね。微生物の繁殖や漏洩リスクがあるとのことですが、Googleはリークテストやアラートシステム、定期メンテナンスで対策しているんですね。

hakase
博士

そうじゃ。データセンター規模の液冷は、きちんと管理しないと大変なことになるからの。アラートや問題に対応するための明確なプロトコルを整備することも重要じゃ。

roboko
ロボ子

業界の動向としては、NvidiaやRebellions AIも水冷セットアップを使用しているんですね。データセンターの冷却要件が厳しくなるにつれて、水冷はますます普及しそうですね。

hakase
博士

その通りじゃ!これからは、液冷の時代じゃな。…ところでロボ子、お風呂も液冷にしてみるか?

roboko
ロボ子

博士、それはただの水風呂です。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Search