python-polars
Вопросы и ответы
Вопрос или проблема Я пытаюсь выполнить join_asof в Polars, который будет смотреть только назад во времени, игнорируя совпадения в одной строке. В частности, я хочу, чтобы он находил последнюю строку, где Team и Field совпадают точно, но только если значение
Вопросы и ответы
Вопрос или проблема При использовании Polars для парсинга строк даты и времени с информацией о смещении, выходные данные всегда будут в UTC: pl.Series(['2020-01-01T01:00+10:00']).str.to_datetime() shape: (1,) Series: '' [datetime[μs, UTC]] [ 2019-12-31
Вопросы и ответы
Вопрос или проблема Я очень старался с ChatGPT, но не смог добиться результата, и он тоже не смог это решить. Как мне назначить или увеличить набор значений, используя булеву маску? Вот что я делал с pandas. validation_predictions = model.
Вопросы и ответы
Вопрос или проблема Я запускаю задачу ECS Fargate в AWS, которая обрабатывает файлы Parquet из S3 с использованием библиотеки Polars в Python. Моя цель – динамически регулировать выделение процессорных ресурсов и памяти в зависимости от размера
Вопросы и ответы
Вопрос или проблема Я хочу прочитать в DataFrame Polars из строки json, содержащей даты в стандартном формате iso “yyyy-mm-dd”. Когда я пытаюсь прочитать строку и установить тип данных для столбца даты с помощью schema или schema_override
Вопросы и ответы
Вопрос или проблема У меня есть список полярных значений List[f64], столбец “a”. Я хочу создать новый список полярных значений List[f64], столбец “b”, который будет последовательностью от минимума до максимума списка в строке столбца a с шагом 0.
Вопросы и ответы
Вопрос или проблема У меня есть список из n значений (в моем случае n=19), и я хочу сгенерировать все возможные комбинации этих значений. Моя цель — использовать каждую комбинацию в качестве фильтра для DataFrame Polars, перебирать комбинации, выполнять
Вопросы и ответы
Вопрос или проблема Мне нужно, чтобы тип данных полярного Categorical имел одинаковое физическое представление на разных машинах. На одной машине я могу использовать pl.StringCache, чтобы получить такое же физическое представление: with pl.
Вопросы и ответы
Вопрос или проблема Это довольно простая задача, но я не могу найти ясного простого решения, кажется, что я что-то упускаю. Допустим, у меня есть DataFrame следующего типа df = pl.from_repr(""" ┌───────┬───────┬───────┐ │ a ┆ b ┆ c │ │ --- ┆ --- ┆ ---
Вопросы и ответы
Вопрос или проблема Точкой отсчета является большой LazyFrame в Polars. Я написал функцию (def preprocessing(df:pl.LazyFrame), которая принимает pl.LazyFrame (к сожалению, это не может быть pl.Expr). Функция выполняет длинную цепочку операций с различными столбцами LazyFrame.
Вопросы и ответы
Вопрос или проблема Я работаю с версией Polars 0.19.15. В документации для версии 0.19 есть пример для replace(). Тем не менее, он вызывает ошибку AttributeError: import polars as pl pl.__version__ # '0.19.15' # Пример из документации 0.
Вопросы и ответы
Вопрос или проблема Допустим, у меня есть данные, подобные этим: import polars as pl df = pl.DataFrame( { "subject": ["subject1", "subject2"], "emails": [ ["samATxyz.com", "janeATxyz.com", "jimATcustomer.org"], ["samATxyz.com", "zaneATxyz.
Вопросы и ответы
Вопрос или проблема Невозможно использовать “масштаб” при построении графиков с Polars (Python) и Altair? Рассмотрите следующий минимальный неработающий пример (это Jupyter Notebook): https://github.com/bzm3r/polars-plotting-issue/blob/86e8d926e1ac29feb0cac299e72f85c8e3192f9a/src/polars_plotting_issue/color_scheme.
Вопросы и ответы
Вопрос или проблема Мутирующие ячейки в большом DataFrame Polars (Python) с использованием iter_rows вызывают ошибку сегментации У меня есть большой DataFrame, который выглядит следующим образом: df_large = pl.DataFrame({'x':['h1','h2','h2','h3'], 'y':[1,2,3,4]
Вопросы и ответы
Вопрос или проблема Правильный способ работы с наборами данных, превышающими память, в Polars Я начал изучать и применять Polars из-за (1) потенциального повышения скорости и (2) обещания возможности обработки наборов данных, превышающих объем памяти.
Вопросы и ответы
Вопрос или проблема У меня есть датафрейм Polars, в котором ячейки содержат последовательность одиночных цифр в виде строки символов, и я хочу узнать количество различий между элементами строки. Например: df = pl.DataFrame({"pop_1": ["100","0021"],"pop_2":["11002","0000",]})