pandas の .groupby() メソッドは、Python でデータセットを分析および変換するために使用されます。データフレームを列の値に基づいてグループに分割し、各グループに関数を適用し、結果を新しいデータフレームに結合します。このテクニックは、集約、フィルタリング、グループ化されたデータの変換などのタスクに不可欠です。.groupby() メソッドは、単一の列または複数の列を指定することで、列名のリストを渡すことでグループ化できます。pandas の一般的な集約メソッドには、.sum()、.mean()、.count() が含まれます。カスタム関数も、pandas の .groupby() でグループに特定の操作を実行するために使用できます。このチュートリアルでは、pandas の経験があることを前提としています。練習用のデータセット、U.S. Congress データセット、空気質データセット、ニュースアグリゲーター データセットを提供します。チュートリアルに従うには、最新の pandas バージョンを新しい仮想環境にインストールし、データセットをダウンロードしてください。データセットは .zip ファイルとしてダウンロードでき、現在のディレクトリ内の groupby-data/ という名前のフォルダーに解凍できます。チュートリアルでは、これらのデータセットを使用して .groupby() の機能を示します。最初の例では、歴史的な米国議会のメンバーに関する公開情報を含む U.S. Congress データセットを使用し、read_csv() を使用して CSV ファイルを pandas のデータフレームに読み込む方法を示します。
realpython.com
Real Python: pandas GroupBy: Your Guide to Grouping Data in Python
