Data Science
пандас датафрейм ничего не показывает, когда просматривается как датафрейм в PyCharm
00
Вопрос или проблема import pandas as pd; dataSet = pd.read_csv("winequality-red.csv"); dataSet.describe(include="all"); Когда просматриваю набор данных в виде фрейма данных, он показывает пустую таблицу. Но при выводе dataSet я получаю следующий результат. <
Data Science
Следует ли очищать шестнадцатеричные адреса набора данных?
00
Вопрос или проблема Я работаю над обнаружением мошенничества в блокчейнах. Более конкретно, я получил большое количество транзакций, которые произошли в блокчейне, пометил их как спам/не спам, используя соответствующий API, и теперь буду обучать модель
Data Science
Как упорядочить значения в разных столбцах в правильном порядке на основе другого фрейма данных (сопоставления) в Python Pandas
00
Вопрос или проблема Я довольно новичок в Python и Pandas и испытываю трудности с объединением неупорядоченного датафрейма из Excel с картой. Я пытался найти решения в Интернете, но безуспешно. Мой первый df_1 выглядит следующим образом: Название продукта
Data Science
Как сравнить и найти общие значения из разных столбцов в одном датафрейме?
00
Вопрос или проблема Я хотел бы сравнить два столбца и найти общие наборы значений в каждом столбце, затем вывести строки с общими значениями. Предположим, у меня есть датафрейм с: no.(col1) | Username (col2) | Referral(col3) | email(col4) 0 | john | mike
Data Science
Эффективно изменить большой csv-файл в Pandas
00
Вопрос или проблема У меня есть CSV-файл, и я хотел бы внести в него следующие изменения: df = pandas.read_csv('some_file.csv') df.index = df.index.map(lambda x: x[:-1]) df.to_csv('some_file.csv') Это убирает последний символ в индексах и сохраняет файл заново.
Data Science
Обновление столбца в pandas DataFrame с использованием функций Apply, Lambda и Group by
00
Вопрос или проблема У меня есть датафрейм в формате, указанном на скриншоте ниже. Столбец ‘Candidate Won‘ имеет значение ‘loss‘ для всех строк. Я хочу обновить столбец ‘Candidate Won’ до значения ‘
Data Science
Питон: преобразовать переменные в правильный формат для DataFrame
00
Вопрос или проблема У меня есть 3 переменных, которые я хотел бы использовать для создания набора данных, но поскольку они имеют странную форму/формат, пока я не имел успеха. Я совсем новичок в этом и буду очень благодарен за любую помощь!
Data Science
Сравнение объекта датафрейма со строковым значением в Django
00
Вопрос или проблема Я реализую модель машинного обучения и использую обучающую выборку из таблицы MySQL, и все это построено на Django. В основном все вычисления выполняются путем преобразования всех данных из таблицы MySQL в датафрейм.
Data Science
Как удалить объект с плавающей запятой в датафрейме? Например: “зима 2021” на “зима”
00
Вопрос или проблема У меня есть столбец, в котором я хочу удалить год и оставить только сезон. Пример: “зима 2021” станет “зима”. Попробуйте df['Column'] = df['Column'].str.replace('\d+', '') это удалит все цифры в столбце Попробуйте
Data Science
Извлечь разделенные значения из столбцов
00
Вопрос или проблема Я работаю с этим CSV файлом, который представляет собой сборник детализации фильмов из IMDB. В нем есть жанры столбец в датафрейме со всеми жанрами фильмов, разделенными символом “|” Мне нужно извлечь первые два жанра из
Data Science
Как сгруппировать по идентификаторам и подсчитать количество групп с появлением переменной после первой точки?
00
Вопрос или проблема Язык: Python 3.8 У меня есть dataframe, который состоит из серии людей (каждый из которых появляется несколько раз в dataframe), дат и бинарных переменных. Я пытаюсь выяснить, сколько людей после конкретного события (отмеченного одной
Data Science
Как добавить вычисляемый столбец в DataFrame Pandas?
00
Вопрос или проблема Я новичок в Python/Pandas, и у меня возникают некоторые трудности. У меня есть DataFrame с данными о качестве воздуха с 2016 по 2020 год. Я хочу рассчитать годовой темп изменения для каждого измеряемого значения, чтобы сравнить их
Data Science
Преобразование датафрейма pandas из нескольких серий в категориальную метку
00
Вопрос или проблема У меня есть датафрейм, настроенный следующим образом: глубина val1 val2 1 0.5 0.6 2 0.4 0.7 3 0.3 0.8 И я хочу получить его в следующем формате: глубина y категория 1 0.5 val1 1 0.6 val2 2 0.4 val1 2 0.7 val2 3 0.
Data Science
Ошибка XGB DataFrame.dtypes
00
Вопрос или проблема Вот код для назначения переменных X = pd.DataFrame(np.c_[df['day'], df['spend'], df['platform'],df['month'],df['year']], columns=[['day', 'spend','platform','month','year']]) y = pd.DataFrame(np.c_[df['revenue']], columns=['revenue'])
Data Science
Каркасные структуры против моделей
00
Вопрос или проблема Мой второй вопрос (Модели против алгоритмов) заключается в том, какова разница между моделями и фреймворками? Сначала давайте взглянем на определения. Согласно Википедии: В компьютерном программировании программный фреймворк — это
Data Science
Создание фрейма данных с нормальным распределением с 3 колонками
00
Вопрос или проблема Я пытаюсь сгенерировать DataFrame с нормальным распределением в Python с тремя колонками. Каждая колонка требует отдельного ввода среднего значения, стандартного отклонения, нижних и верхних значений. Я пытаюсь сгенерировать данные
Data Science
Как добавить полосы ошибок к линейному графику Matplotlib?
00
Вопрос или проблема У меня есть следующий набор данных, который я использую для построения линейного графика. График получается как среднее значений, полученных из данных. Я хочу добавить ошибочные полосы к этому графику, которые будут показывать стандартное отклонение.
Data Science
Построить датафрейм с несколькими CSV
00
Вопрос или проблема Я собираю метрики по 6 REST-сервисам из архитектуры микросервисов. Для каждого собранного момента я извлекаю два CSV-файла из каждого сервиса. Один CSV содержит три метрики задержки (99-й процентиль, 50-й процентиль, среднее значение).
Data Science
Кумулятивная сумма с начальным значением, отличным от 0, в Pandas
00
Вопрос или проблема У меня есть следующий датафрейм df атлетов (индексированный по Athlete_ID) и их рангу (индексированный по Rank), вот слайд датафрейма с конкретным атлетом: Rank Athlete_ID Date 13 143 25/4/2021 1 143 5/4/2021 6 143 24/2/2021 11 143
Data Science
Постройте три серии на одном графике, группируя данные по дням и месяцам.
00
Вопрос или проблема У меня есть набор данных, содержащий данные за три года, которые я хотел бы отобразить и сравнить по дате и месяцу; но я испытываю трудности с конечным результатом. Я почти на месте, но по какой-то странной причине, когда я строю график