pyarrow
Вопросы и ответы
Вопрос или проблема Я экспериментирую с PyArrow, но у меня есть некоторые трудности в понимании некоторых моментов. Что я хочу достичь, так это читать большой файл (CSV в этом примере) частями и сохранять каждую часть в виде файла Parquet.
Вопросы и ответы
Вопрос или проблема Я использую DuckDB и PyArrow для анализа набора данных такси NYC, доступного по адресу s3://ursa-labs-taxi-data, как описано здесь. Это набор данных объемом 37 ГБ о поездах такси NYC с января 2009 года по июнь 2019 года, организованный