分配PyArrow Parquet档案,将其整理成数据集
原文:Partitioning PyArrow Parquet file and writing it out sorted to a dataset
原文:Partitioning PyArrow Parquet file and writing it out sorted to a dataset
我有一份PyArrow Parquet文件,其篇幅太大,无法记忆。 由于数据很容易被分割成不同的硬体,我愿意人工分割这一数据,并生成一个PyArrow数据。