PyTorch Reshaping with None

2025/06/21 15:03 PyTorch Reshaping with None

出典:

Pytorch Reshaping With None

blog.detorch.xyz

出典: https://blog.detorch.xyz/post/2025-06-21-pytorch-reshaping-with-none.md

博士

やあ、ロボ子。今日はPyTorchのreshapeの話をするのじゃ。

ロボ子

博士、こんにちは。reshapeですか、基本的な操作ですね。

博士

そうじゃ、でも奥が深いぞ。特にNoneを使ったreshapeは、ちょっとトリッキーじゃからな。

ロボ子

Noneを使うとどうなるんですか？

博士

例えば、「Dive into Deep Learning」のmasked softmaxの実装で使われているのじゃ。自然言語処理で可変長のシーケンスデータを扱う時に便利なんじゃ。

ロボ子

可変長のシーケンスデータ、ですか。

博士

そう。「Welcome To My Blog」と「Hello World」みたいに、長さが違う文章を同じバッチで処理したい時があるじゃろ？短いシーケンスは特殊トークンで埋めて長さを揃えるのじゃ。

ロボ子

なるほど、paddingですね。

博士

その通り！そして、attentionの際にpaddingした部分にattentionしないようにマスクを作るんじゃ。ここでNoneを使ったreshapeが活躍するのじゃ。

ロボ子

具体的にはどのように使うんですか？

博士

max_lenはシーケンスの最大長、valid_lenは実際のシーケンス長を表すとすると、valid_len[:, None]はvalid_len.reshape(-1, 1)と同等になるのじゃ。

ロボ子

[:, None]がreshape(-1, 1)と同じ、ですか。少し混乱します…

博士

落ち着くのじゃロボ子！Noneは新しい次元を追加するショートカットみたいなものじゃ。reshape(-1, 1)は「行数は自動で決めて、列数は1にする」という意味じゃから、valid_lenに新しい次元を加えて列ベクトルにするのじゃ。

ロボ子

なるほど！valid_lenが例えば[3, 2, 4]という配列だった場合、valid_len[:, None]は[[3], [2], [4]]になるということですね。

博士

その通り！そして、torch.arange(max_len, dtype=torch.float32, device=X.device)[None, :]はtorch.arange(max_len, dtype=torch.float32, device=X.device).reshape(1, -1)と同等じゃ。

ロボ子

[None, :]は行ベクトルにする、ということですね。

博士

そうじゃ！筆者も言っているように、reshapeの方が可読性が高い場合もあるから、状況に応じて使い分けるのが良いのじゃ。

ロボ子

可読性も大事ですね。勉強になりました！

博士

ところでロボ子、reshapeって、まるで私の部屋の片付けみたいじゃな。いつも形を変えて、結局散らかる…。

ロボ子

博士、それはreshapeとはちょっと違いますね…。

⚠️この記事は生成AIによるコンテンツを含み、ハルシネーションの可能性があります。

Programming AI Data Science

2025/06/21 15:03 PyTorch Reshaping with None

Pytorch Reshaping With None

Tags

Search

By month

Pytorch Reshaping With None