parquet

  1. PySparkでS3のParquetファイルを再帰的に読み込む

  2. Dockerでparquet-toolsを使ってsnappy圧縮されたparquetファイルの中身を確認する