PyArrow と FastParquet は、Parquet ファイルの読み書きを行う人気の Python ライブラリです。PyArrow は Parquet フォーマットを完全にサポートし、Apache Arrow エコシステムとも連携して機能するため、複雑なユースケースや大規模なデータに適しています。FastParquet は高速かつ軽量で、単純なタスクや日々のデータ分析に理想的です。どちらのライブラリも、パーティションされたデータセットを処理し、Pandas と連携できます。どちらかを選択する際には、ユースケースの複雑さとデータセットのサイズを考慮する必要があります。
dev.to
All About Parquet Part 08 - Reading and Writing Parquet Files in Python
Create attached notes ...