python-polars - ответы на вопросы

Вопросы и ответы

Как выполнить join_asof в Polars, рассматривая только назад и соответствуя определенным условиям?

00

Вопрос или проблема Я пытаюсь выполнить join_asof в Polars, который будет смотреть только назад во времени, игнорируя совпадения в одной строке. В частности, я хочу, чтобы он находил последнюю строку, где Team и Field совпадают точно, но только если значение

Вопросы и ответы

Как мне получить разобранный смещение часового пояса при разборе строк с учетом часового пояса с помощью Polars?

00

Вопрос или проблема При использовании Polars для парсинга строк даты и времени с информацией о смещении, выходные данные всегда будут в UTC: pl.Series(['2020-01-01T01:00+10:00']).str.to_datetime() shape: (1,) Series: '' [datetime[μs, UTC]] [ 2019-12-31

Вопросы и ответы

Арифметическая операция в Polars с использованием булевой маски и массивов разного размера

00

Вопрос или проблема Я очень старался с ChatGPT, но не смог добиться результата, и он тоже не смог это решить. Как мне назначить или увеличить набор значений, используя булеву маску? Вот что я делал с pandas. validation_predictions = model.

Вопросы и ответы

Как определить оптимальные ЦП и память для задач ECS Fargate на основе размера файлов Parquet.

00

Вопрос или проблема Я запускаю задачу ECS Fargate в AWS, которая обрабатывает файлы Parquet из S3 с использованием библиотеки Polars в Python. Моя цель – динамически регулировать выделение процессорных ресурсов и памяти в зависимости от размера

Вопросы и ответы

polars (python-api): read_json не удается разобрать дату

00

Вопрос или проблема Я хочу прочитать в DataFrame Polars из строки json, содержащей даты в стандартном формате iso “yyyy-mm-dd”. Когда я пытаюсь прочитать строку и установить тип данных для столбца даты с помощью schema или schema_override

Вопросы и ответы

Как создать последовательность чисел с плавающей точкой в Polars типа List[f64]

00

Вопрос или проблема У меня есть список полярных значений List[f64], столбец “a”. Я хочу создать новый список полярных значений List[f64], столбец “b”, который будет последовательностью от минимума до максимума списка в строке столбца a с шагом 0.

Вопросы и ответы

Эффективное управление большими комбинациями в Polars без перегрузки оперативной памяти

00

Вопрос или проблема У меня есть список из n значений (в моем случае n=19), и я хочу сгенерировать все возможные комбинации этих значений. Моя цель — использовать каждую комбинацию в качестве фильтра для DataFrame Polars, перебирать комбинации, выполнять

Вопросы и ответы

Синхронизация pl.StringCache / Категориальное кодирование на различных машинах в Polars

00

Вопрос или проблема Мне нужно, чтобы тип данных полярного Categorical имел одинаковое физическое представление на разных машинах. На одной машине я могу использовать pl.StringCache, чтобы получить такое же физическое представление: with pl.

Вопросы и ответы

Проверьте, есть ли хотя бы одно значение True в DataFrame Polars.

00

Вопрос или проблема Это довольно простая задача, но я не могу найти ясного простого решения, кажется, что я что-то упускаю. Допустим, у меня есть DataFrame следующего типа df = pl.from_repr(""" ┌───────┬───────┬───────┐ │ a ┆ b ┆ c │ │ --- ┆ --- ┆ ---

Вопросы и ответы

Что возвращать в функции предварительной обработки для оптимальной производительности

00

Вопрос или проблема Точкой отсчета является большой LazyFrame в Polars. Я написал функцию (def preprocessing(df:pl.LazyFrame), которая принимает pl.LazyFrame (к сожалению, это не может быть pl.Expr). Функция выполняет длинную цепочку операций с различными столбцами LazyFrame.

Вопросы и ответы

Polars 0.19 AttributeError: у объекта ‘Expr’ нет атрибута ‘replace’

00

Вопрос или проблема Я работаю с версией Polars 0.19.15. В документации для версии 0.19 есть пример для replace(). Тем не менее, он вызывает ошибку AttributeError: import polars as pl pl.__version__ # '0.19.15' # Пример из документации 0.

Вопросы и ответы

Как я могу отфильтровать список в столбце Polars?

00

Вопрос или проблема Допустим, у меня есть данные, подобные этим: import polars as pl df = pl.DataFrame( { "subject": ["subject1", "subject2"], "emails": [ ["samATxyz.com", "janeATxyz.com", "jimATcustomer.org"], ["samATxyz.com", "zaneATxyz.

Вопросы и ответы

Невозможно использовать “масштаб” при построении графиков с Polars (Python) и Altair?

00

Вопрос или проблема Невозможно использовать “масштаб” при построении графиков с Polars (Python) и Altair? Рассмотрите следующий минимальный неработающий пример (это Jupyter Notebook): https://github.com/bzm3r/polars-plotting-issue/blob/86e8d926e1ac29feb0cac299e72f85c8e3192f9a/src/polars_plotting_issue/color_scheme.

Вопросы и ответы

Мутирующие ячейки в большом DataFrame Polars (Python) с использованием iter_rows вызывают ошибку сегментации

00

Вопрос или проблема Мутирующие ячейки в большом DataFrame Polars (Python) с использованием iter_rows вызывают ошибку сегментации У меня есть большой DataFrame, который выглядит следующим образом: df_large = pl.DataFrame({'x':['h1','h2','h2','h3'], 'y':[1,2,3,4]

Вопросы и ответы

Правильный способ работы с наборами данных, превышающими память, в Polars

00

Вопрос или проблема Правильный способ работы с наборами данных, превышающими память, в Polars Я начал изучать и применять Polars из-за (1) потенциального повышения скорости и (2) обещания возможности обработки наборов данных, превышающих объем памяти.

Вопросы и ответы

Поиск количества различий между строками в Polars

00

Вопрос или проблема У меня есть датафрейм Polars, в котором ячейки содержат последовательность одиночных цифр в виде строки символов, и я хочу узнать количество различий между элементами строки. Например: df = pl.DataFrame({"pop_1": ["100","0021"],"pop_2":["11002","0000",]})