Data Science
Данные, полученные вне Pandas DataFrame
00
Вопрос или проблема Я новичок в Python, когда я получил этот DataFrame из Yahoo Finance, столбец с датами отображается вне DataFrame. Это приводит к возникновению ошибки KeyError: ‘Date’, когда я пытаюсь выполнить эту строку кода Close_Price[‘
Вопросы и ответы
Представление пропущенных значений в агрегированном DataFrame Pandas
00
Вопрос или проблема При применении агрегирования к сгруппированному DataFrame pandas агрегированный вывод, похоже, содержит разные значения для агрегированных колонок с отсутствующими значениями, в зависимости от типа колонки DataFrame.
Вопросы и ответы
Панды: Как заменить часть значений столбца на те же значения в определенной серии? [дубликат]
00
Вопрос или проблема На этот вопрос уже есть ответы здесь: Как назначить столбцы, игнорируя выравнивание индексов (3 ответа) Назначение DataFrame в DataFrame в Pandas, не выравнивающее и производящее NaN (1 ответ) Pandas –
Data Science
Заполните пустые значения в датафрейме с условием
00
Вопрос или проблема traindf[traindf['Gender'] == 'female']['Age'].fillna(value=femage,inplace=True) Я пытался обновить нулевые значения в колонке возраста в датафрейме средними значениями. Здесь я пытался заменить нулевые значения в колонке возраста для
Data Science
Разделение датафрейма на основе содержимого строк
00
Вопрос или проблема У меня есть датафрейм с 50000 строк и 5 столбцов. В столбце VarName есть два типа данных: 1 – DatiStatistica_CombiWeight, 2 – DatiStatistica_TargetWeight Я отфильтровал строки, содержащие DatiStatistica_TargetWeight Я хотел
Data Science
Исследовательский анализ данных на наборе, разделенном на победителей и проигравших
00
Вопрос или проблема У меня есть набор данных о характеристиках победителей теннисных турниров и о характеристиках проигравших: возраст_победителя, рейтинг_победителя / возраст_проигравшего, рейтинг_проигравшего Чтобы провести надлежащий EDA, мне нужно
Data Science
Извлечение структурированных данных из полуструктурированных данных
00
Вопрос или проблема Я хочу использовать машинное обучение и обработку естественного языка (NLP), чтобы преобразовать полуструктурированные данные в текстовых файлах в структурированные данные, предсказывая паттерны в файлах и разбивая поля.
Data Science
Как сравнить 4 столбца в отдельных датафреймах и оценить, совпадают ли их значения.
00
Вопрос или проблема Я хотел бы сравнить 4 столбца из 2 различных наборов данных и оценить, имеют ли они одинаковые значения статуса. Возможно ли проверить/подсчитать, сколько IDNos имеют разные статусы и сколько имеют одинаковый статус, а также какие
Data Science
Pyspark Dataframes в Pandas и ML Ops – Задержка при параллельном выполнении?
00
Вопрос или проблема Если я преобразую Spark DataFrame в Pandas DataFrame, а затем применю операции Pandas и модели sklearn к набору данных в Databricks, будут ли операции из Pandas и sklearn распределены по кластеру? Или мне нужно использовать операции
Вопросы и ответы
Дорожная карта и ресурсы для живого кодирования на интервью по Python (Data Science) [закрыто]
00
Вопрос или проблема Закрыто. Этот вопрос не о программировании или разработке программного обеспечения. В настоящее время он не принимает ответов. Этот вопрос, похоже, не связан с конкретной программной проблемой, программным алгоритмом или программными
Data Science
Попытка написать код, который определяет максимальное значение перед снижением наклона.
00
Вопрос или проблема Я пытаюсь написать код для теста на силу, который выведет максимальное значение силы до того, как произойдет структурный сбой. Я немного новичок в Python, поэтому проблема может быть простой, и я что-то упускаю.
Data Science
Как подготовить данные, если каждый элемент имеет несколько категорий (например, теги)
00
Вопрос или проблема Я работаю над рекомендательной системой, которая будет рекомендовать фильмы пользователям. Оценки фильмов Фильм Пользователь Оценка 100 201 5 105 256 8 … … … Теги фильмов Фильм Тег 100 1 100 2 100 8 105 2 105 5 …
Вопросы и ответы
Формат маски Dataframe Python для очистки свободного формата данных до и после специального символа ‘-‘
00
Вопрос или проблема Я экспортирую таблицу из базы данных в pandas dataframe и пытаюсь применить маску формата для очистки некоторого текста свободного формата, содержащегося в одном из столбцов. Я хочу создать новый столбец в dataframe, чтобы извлечь
Data Science
Сжатие категориальных данных в более чем 3 категории
00
Вопрос или проблема У меня есть множество категориальных данных, относящихся к частям речи, которые я хочу свести к меньшему числу категорий. np.where() не подойдет, потому что я хочу в итоге получить 6 категорий: существительное, глагол, прилагательное
Data Science
Как выполнить (модифицированный) t-тест для нескольких переменных и моделей в Python (машинное обучение)
00
Вопрос или проблема Я создал и проанализировал около 16 моделей машинного обучения, используя WEKA. В данный момент у меня есть CSV-файл, который показывает метрики моделей (такие как percent_correct, F-measure, recall, precision и т.
Data Science
Python: Как построить график временного интервала из DataFrame в Pandas
00
Вопрос или проблема У меня есть датафрейм (df), который содержит данные о выполнении задания в разные временные интервалы. Он включает в себя следующие детали о выполнении задания: Время начала задания (START) Время окончания задания (END) Временной интервал (interval), т.
Вопросы и ответы
Скорректированная цена закрытия от yfinance не совпадает с общим ответом от Yahoo Finance.
00
Вопрос или проблема Я пытаюсь рассчитать месячную и годовую доходность в процентах для фонда, подобного VSMPX. Я понимаю, что скорректированная цена закрытия из yfinance учитывает дробления и дивиденды. Чтобы получить процентную доходность, я делаю следующее
Data Science
удаление столбца с более чем 60% пропущенных значений
00
Вопрос или проблема Как это указано в заголовке, я работаю с набором данных, и в определенном столбце отсутствует около 60% значений. Должен ли я просто удалить этот столбец вместо импутации? Причина заключается в том, что я работаю с набором данных о
Вопросы и ответы
Постоянная ошибка переименования индекса (или это индекс?) в DataFrame pandas
00
Вопрос или проблема Это должно быть просто. У меня есть датафрейм pandas с датой в качестве индекса; это периодический индекс. Когда я строю график данных, легенда упоминает “Series”, в то время как я хочу, чтобы она показывала “
Вопросы и ответы
Пометьте последующие строки после изменения значения в одном столбце, если это основано на условии в столбце B.
00
Вопрос или проблема У меня есть проблема с следующими данными: месяц продукт версия цена категория 1 A alpha 500 foo 2 A alpha 500 foo 3 A alpha 550 foo 4 A alpha 600 bar 5 A alpha 500 bar 6 A alpha 500 faz 7 A alpha 500 faz 8 A alpha 500 faz […]