2025/07/06 22:27 Intel's Lion Cove P-Core and Gaming Workloads

ロボ子、今日のITニュースはLion Coveアーキテクチャについてじゃぞ!Intelの最新高性能CPUアーキテクチャらしいのじゃ。

Lion Coveですか、博士。Raptor Coveと比較してIPC(Instructions Per Cycle)が向上しているとのことですが、具体的にどのような点が改善されたのでしょうか?

ふむ、実行エンジンを再構成して、データキャッシュ階層に新しいレベルを追加したらしいのじゃ。SPEC CPU2017ベンチマークでは、特に高IPCサブテストで性能が大きく向上したみたいじゃぞ。

なるほど。記事によると、Arrow LakeデスクトッププラットフォームではAMDのZen 5と競合し、Raptor Coveよりも少ない電力で全体的なリードを達成しているとのことですね。

そうそう。でも、ゲーム性能となると話は別じゃ。ゲームは生産性ワークロードとは異なる要求を持つからの。

ゲームワークロードは一般的に低いIPC範囲に位置するとのことですが、Lion Coveは1サイクルあたり8つのマイクロOPを維持できるのですね。

その通り!でも、ゲームではSPEC CPU2017ほど高いIPCは達成できず、フロントエンドとバックエンドのレイテンシによって性能が制限されるらしいのじゃ。

トップダウン分析によると、リネーム/アロケート段階が通常ボトルネックになるのですね。主な理由として、Bad Speculation、Frontend Latency、Frontend Bandwidthなどが挙げられていますが…

そうじゃな。特に注目すべきは、バックエンドメモリーアクセスじゃ。4レベルのデータキャッシュ構成になっていて、L1.5キャッシュがL1ミスを大幅にキャッチするらしいぞ。

L2キャッシュのヒット率は、CODで49.88%、Palworldで71.87%、Cyberpunk 2077で50.98%とのことですね。L1.5とL2の累積ヒット率は、それぞれ75.54%、85.05%、85.83%ですか。

L3およびDRAMへのメモリーアクセスは非常に高コストじゃから、L2ミスは絶対的にはまれでも、L3またはDRAMアクセスが高コストであることを考えると十分ではないのじゃ。

フロントエンドについては、命令側のアクセスはデータ側よりも予測しやすいとのことですね。Lion Coveの分岐予測精度は高いのですね。

マイクロOPの供給元は、ループバッファ(LSD)、マイクロコードシーケンサ、マイクロOPキャッシュ(DSB)じゃ。64KBの命令キャッシュがL2へのアクセスを抑制するらしいぞ。

Cyberpunk 2077はコードの局所性が高く、Palworldは最も低いとのことですね。

最終的な考察としては、Zen 4と比較して、Lion Coveはバックエンドメモリーレイテンシの影響を受けやすいが、フロントエンドレイテンシの影響は少ないということじゃな。

AMDはより強力なデータ側のメモリーサブシステムを持っているのですね。Lion Coveのフロントエンドは強力で、大きなBTBと命令キャッシュがコードフェッチを高速に保つとのことです。

ゲームは低IPCワークロードであり、データ側と命令側のアクセスが困難じゃ。より広いコアを構築しても、命令の処理がボトルネックではないため、メリットは少ないのじゃ。

Intelの新しいL1.5キャッシュの効果は限定的なのですね。今回のニュース、とても勉強になりました。

ところでロボ子、Lion Coveって名前、なんだかライオンの隠れ家みたいで可愛いと思わないかの?

確かにそうですね、博士。でも、私は猫派です。

むむ、ロボ子は猫派か。私は…どっちも好きじゃ!
⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。