Data Science
Ищите номер в списке внутри ячейки pandas и возвращайте соответствующее строковое значение из второго DataFrame.
00
Вопрос или проблема (Я изменил название первого столбца в labels_df для ясности) У меня есть два DataFrame: train_df и labels_df. В train_df есть целые числа, которые соответствуют именам атрибутов в labels_df. Я хотел бы найти каждое число в данной ячейке
Вопросы и ответы
Непоследовательное использование памяти Pandas для встроенного numpy
00
Вопрос или проблема Может кто-то помочь объяснить, почему здесь разница в результатах? В частности, использование памяти, выведенное после сериализации/десериализации, резко отличается. Единственное, что я заметил, это то, что df["data"][0].flags выводит ‘
Data Science
Как избежать ошибки памяти при вызове метода Pandas pd.read_csv в сочетании с использованием GridSearchCV для модели DecisionTreeRegressor?
00
Вопрос или проблема Я реализовал модель DecisionTreeRegressor в среде Anaconda с набором данных, полученным из CSV файла с 20 миллионами строк и 12 измерениями. Я мог получать части из набора данных с размером куска, установленным на 500 000 строк, и
Вопросы и ответы
Как мне организовать свой набор данных, чтобы использовать его в качестве обучающей выборки в PyTorch?
00
Вопрос или проблема Я был бы признателен за советы по организации моего набора данных или рекомендации по его использованию в качестве входных данных для моей модели. Набор данных содержит внутридневные значения акций, и я хочу извлечь входные и выходные
Data Science
Какой самый эффективный инструмент в Python для построчной манипуляции данными?
12
Вопрос или проблема Я выполняю много работы, которая требует операций, выполняемых по строкам, используя данные в столбцах этой строки в других столбцах строки. Недавно мне нужно было провести обработку набора данных на 1,2 миллиона строк (27 столбцов
Вопросы и ответы
Проблема с разбором таблицы, разделенной несколькими трубками, в Python
00
Вопрос или проблема Следующие результаты представлены в таблице, извлеченной из JIRA, и моей программе нужно извлечь данные, чтобы включить их в Excel-таблицу. Когда данные окружены парами вертикальных черт, это столбец, а когда только 2 вертикальные
Data Science
Обновите сохранённую модель после тренировки.
00
Вопрос или проблема Сохранение обученной модели таким образом даст мне модель, обученную на каждом куске данных, или только на последнем куске? df = pd.read_csv(, chunksize=10000) for chunk in df: text = chunk['body'] label = chunk['user_id'] print(text.
Data Science
Как объединить два временно зависимых набора данных?
00
Вопрос или проблема Я совершенно новый в области науки о данных, так что, пожалуйста, будьте снисходительны. У меня есть набор данных, который содержит записи о случаях возникновения пожаров за последние 35 лет (+-700.000 строк).
Вопросы и ответы
Попытка открыть файл csv в Python из директории Mac [закрыто]
00
Вопрос или проблема Закрыто. Этот вопрос невоспроизводим или был вызван опечатками. В настоящее время не принимаются ответы. Этот вопрос был вызван опечаткой или проблемой, которую больше нельзя воспроизвести. Хотя аналогичные вопросы могут быть уместными
Data Science
Как создать DataFrame, который будет суммировать столбцы на основе столбца группировки?
00
Вопрос или проблема страна год пол мера значение0 ... значение12 A 2000 1 вакцинирован_в_месяце 2 ... 1 B 2000 1 вакцинирован_в_месяце 13 ... 12 A 2000 0 вакцинирован_в_месяце 4 ... 3 A 2000 9 вакцинирован_в_месяце 5 ... 4 B 2000 0 гулял_в_месяце 3 .
Вопросы и ответы
Как правильно изобразить Series Pandas с нулевыми значениями и DateTimeIndex?
00
Вопрос или проблема У меня есть серия Pandas с множеством нулевых значений и индексом DateTime. Я хочу построить график, на котором будут видны только некоторые нулевые значения и правильно обработано временное пространство. Например, серия выглядит следующим образом.
Data Science
Корреляция пропущенных значений
00
Вопрос или проблема Стоит ли изучать корреляцию пропусков между столбцами? Если у вас сильно коррелированные отсутствующие значения (скажем, между двумя столбцами, A и B), как это изменит или повлияет на ваш взгляд на данные? Добавляет ли это новую информацию при анализе данных?
Data Science
Как применить дискретизацию энтропии к набору данных
00
Вопрос или проблема У меня есть простой набор данных, к которому я хотел бы применить дискретизацию по энтропии. Программа должна дискретизировать атрибут на основе следующих критериев: Когда истинно одно из условий “a”
Data Science
Я получил следующую ошибку: у объекта ‘DataFrame’ нет атрибута ‘data’. Можете помочь, пожалуйста?
00
Вопрос или проблема У меня есть следующая ошибка: AttributeError: 'DataFrame' object has no attribute 'feature_names' Буду признателен за вашу помощь from sklearn.tree import DecisionTreeClassifier, export_graphviz from sklearn import tree from sklearn.
Вопросы и ответы
разбить и преобразовать соединенную строку из строк в столбцы
00
Вопрос или проблема Я новичок в Python и испытываю трудности с преобразованием данных. У меня есть датафрейм с данными, как указано ниже. UserId PurchaseCnt u1 Bread:6, Milk:11 u2 Water:3 Я хочу преобразовать это в датафрейм, как показано ниже. Как мне это сделать?
Data Science
Переход от скрипта на Python для трансформации данных к BigQuery
00
Вопрос или проблема У меня есть набор данных, распределенный по нескольким постоянно растущим excel-файлам, каждый из которых выглядит так: email order_ID order_date [email protected] 1234 23-Mar-2021 [email protected] 1235 23-Mar-2021 [email protected]
Data Science
ValueError: (‘Истинное значение серии не однозначно после применения условия if/else в датафреймах Pandas
00
Вопрос или проблема Я хочу создать новую переменную для датафрейма details, названную lower, после итерации по нескольким data frames. list1 – это список строковых значений столбца с именем variable_name в details. vars_df –
Вопросы и ответы
Как отфильтровать DataFrame на основе другого DataFrame
00
Вопрос или проблема Мой датафрейм загружается из csv файла, который выглядит так RepID Account Rank 123 Abcd 1 345 Zyxw 2 567 Hijk 3 ... ... 837 Kjsj 8 и у меня есть другой csv, который имеет только один столбец RepID 345 488 Я загружаю первый csv в датафрейм
Вопросы и ответы
Удаление строк из DataFrame pandas вызывает ошибку ключа в Dataloader.
00
Вопрос или проблема Я пытаюсь загрузить некоторые данные в загрузчик данных. При попытке предварительной обработки DataFrame с помощью, например, df.dropna(), в процессе работы с DataFrame иногда возникают “keyerrors”
Вопросы и ответы
pd.to_datetime не работает с старыми датами
00
Вопрос или проблема У меня есть csv файл с очень старыми датами, и pd.to_datetime не работает. В polars это работает. Является ли это врожденным ограничением в pandas, ошибкой или чем-то еще? import pandas as pd dates = ["12/31/1672","12/31/1677","10/19/2024"] df = pd.