MaxPool3dは、4Dや5Dテンソルの1つ以上の要素から3D maxプーリングによって計算された1つ以上の値の4Dや5Dテンソルを計算できます。カーネルサイズ、ストライド、パディング、ジレーションの引数は、1以上の整数でなければならず、return_indicesとceil_modeの引数はブール型フラグです。
デフォルトでは、テンソルのrequires_grad属性はFalseで、MaxPool3dを使用した後もFalseのままです。
return_indicesがFalseの場合、MaxPool3dは出力テンソンのみを返します。return_indicesがTrueの場合、入力テンソル内の最大値のインデックスを含むテンソルも返します。
カーネルサイズを増やすと、受容野が大きくなり、出力サイズが小さくなります。一方、ストライドを増やすと、出力サイズが小さくなり、受容野に隙間が生じます。パディングを使用することで、入力テンソル周囲にゼロを追加し、出力サイズを制御し、情報損失を避けることができます。
ジレーションを増やすと、カーネルの要素間の距離が広がり、出力サイズが減少しないまま大きな受容野を実現できます。ceilモードでは、出力サイズが常に最寄りの整数に丸め上がり、特定のアプリケーションで有用です。
dev.to
MaxPool3d() in PyTorch
Create attached notes ...
