この投稿は3つのパートに分かれています。以下の通りです: • コンテキストベクトルの理解 • 異なるレイヤーのコンテキストベクトルの視覚化 • アテンションパターンの視覚化 伝統的な単語埋め込み(Word2VecやGloVeなど)と異なり、コンテキストに関係なく各単語に固定ベクトルを割り当てるのではなく、トランスフォーマーモデルは周囲の単語に依存するダイナミックな表現を生成します。
machinelearningmastery.com
Generating and Visualizing Context Vectors in Transformers
Create attached notes ...
