トランスフォーマーモデルの注意マスキングへのやさしい導入

この投稿は4つのパートに分かれています。它们は次の通りです：• アテンション・マスキングが必要な理由 • アテンション・マスクの実装 • マスクの作成 • PyTorchのビルトイン・アテンションの使用