pandas
Data Science
Вопрос или проблема Я новичок в Python, когда я получил этот DataFrame из Yahoo Finance, столбец с датами отображается вне DataFrame. Это приводит к возникновению ошибки KeyError: ‘Date’, когда я пытаюсь выполнить эту строку кода Close_Price[‘
Вопросы и ответы
Вопрос или проблема При применении агрегирования к сгруппированному DataFrame pandas агрегированный вывод, похоже, содержит разные значения для агрегированных колонок с отсутствующими значениями, в зависимости от типа колонки DataFrame.
Вопросы и ответы
Вопрос или проблема На этот вопрос уже есть ответы здесь: Как назначить столбцы, игнорируя выравнивание индексов (3 ответа) Назначение DataFrame в DataFrame в Pandas, не выравнивающее и производящее NaN (1 ответ) Pandas –
Data Science
Вопрос или проблема traindf[traindf['Gender'] == 'female']['Age'].fillna(value=femage,inplace=True) Я пытался обновить нулевые значения в колонке возраста в датафрейме средними значениями. Здесь я пытался заменить нулевые значения в колонке возраста для
Data Science
Вопрос или проблема У меня есть датафрейм с 50000 строк и 5 столбцов. В столбце VarName есть два типа данных: 1 – DatiStatistica_CombiWeight, 2 – DatiStatistica_TargetWeight Я отфильтровал строки, содержащие DatiStatistica_TargetWeight Я хотел
Data Science
Вопрос или проблема У меня есть набор данных о характеристиках победителей теннисных турниров и о характеристиках проигравших: возраст_победителя, рейтинг_победителя / возраст_проигравшего, рейтинг_проигравшего Чтобы провести надлежащий EDA, мне нужно
Data Science
Вопрос или проблема Я хочу использовать машинное обучение и обработку естественного языка (NLP), чтобы преобразовать полуструктурированные данные в текстовых файлах в структурированные данные, предсказывая паттерны в файлах и разбивая поля.
Data Science
Вопрос или проблема Я хотел бы сравнить 4 столбца из 2 различных наборов данных и оценить, имеют ли они одинаковые значения статуса. Возможно ли проверить/подсчитать, сколько IDNos имеют разные статусы и сколько имеют одинаковый статус, а также какие
Data Science
Вопрос или проблема Если я преобразую Spark DataFrame в Pandas DataFrame, а затем применю операции Pandas и модели sklearn к набору данных в Databricks, будут ли операции из Pandas и sklearn распределены по кластеру? Или мне нужно использовать операции
Вопросы и ответы
Вопрос или проблема Закрыто. Этот вопрос не о программировании или разработке программного обеспечения. В настоящее время он не принимает ответов. Этот вопрос, похоже, не связан с конкретной программной проблемой, программным алгоритмом или программными
Data Science
Вопрос или проблема Я пытаюсь написать код для теста на силу, который выведет максимальное значение силы до того, как произойдет структурный сбой. Я немного новичок в Python, поэтому проблема может быть простой, и я что-то упускаю.
Data Science
Вопрос или проблема Я работаю над рекомендательной системой, которая будет рекомендовать фильмы пользователям. Оценки фильмов Фильм Пользователь Оценка 100 201 5 105 256 8 … … … Теги фильмов Фильм Тег 100 1 100 2 100 8 105 2 105 5 …
Вопросы и ответы
Вопрос или проблема Я экспортирую таблицу из базы данных в pandas dataframe и пытаюсь применить маску формата для очистки некоторого текста свободного формата, содержащегося в одном из столбцов. Я хочу создать новый столбец в dataframe, чтобы извлечь
Data Science
Вопрос или проблема У меня есть множество категориальных данных, относящихся к частям речи, которые я хочу свести к меньшему числу категорий. np.where() не подойдет, потому что я хочу в итоге получить 6 категорий: существительное, глагол, прилагательное
Data Science
Вопрос или проблема Я создал и проанализировал около 16 моделей машинного обучения, используя WEKA. В данный момент у меня есть CSV-файл, который показывает метрики моделей (такие как percent_correct, F-measure, recall, precision и т.
Data Science
Вопрос или проблема У меня есть датафрейм (df), который содержит данные о выполнении задания в разные временные интервалы. Он включает в себя следующие детали о выполнении задания: Время начала задания (START) Время окончания задания (END) Временной интервал (interval), т.
Вопросы и ответы
Вопрос или проблема Я пытаюсь рассчитать месячную и годовую доходность в процентах для фонда, подобного VSMPX. Я понимаю, что скорректированная цена закрытия из yfinance учитывает дробления и дивиденды. Чтобы получить процентную доходность, я делаю следующее
Data Science
Вопрос или проблема Как это указано в заголовке, я работаю с набором данных, и в определенном столбце отсутствует около 60% значений. Должен ли я просто удалить этот столбец вместо импутации? Причина заключается в том, что я работаю с набором данных о
Вопросы и ответы
Вопрос или проблема Это должно быть просто. У меня есть датафрейм pandas с датой в качестве индекса; это периодический индекс. Когда я строю график данных, легенда упоминает “Series”, в то время как я хочу, чтобы она показывала “
Вопросы и ответы
Вопрос или проблема У меня есть проблема с следующими данными: месяц продукт версия цена категория 1 A alpha 500 foo 2 A alpha 500 foo 3 A alpha 550 foo 4 A alpha 600 bar 5 A alpha 500 bar 6 A alpha 500 faz 7 A alpha 500 faz 8 A alpha 500 faz […]