pandas - ответы на вопросы - Page 7 of 8

Вопросы и ответы

Формат маски Dataframe Python для очистки свободного формата данных до и после специального символа ‘-‘

00

Вопрос или проблема Я экспортирую таблицу из базы данных в pandas dataframe и пытаюсь применить маску формата для очистки некоторого текста свободного формата, содержащегося в одном из столбцов. Я хочу создать новый столбец в dataframe, чтобы извлечь

Data Science

Сжатие категориальных данных в более чем 3 категории

00

Вопрос или проблема У меня есть множество категориальных данных, относящихся к частям речи, которые я хочу свести к меньшему числу категорий. np.where() не подойдет, потому что я хочу в итоге получить 6 категорий: существительное, глагол, прилагательное

Data Science

Как выполнить (модифицированный) t-тест для нескольких переменных и моделей в Python (машинное обучение)

00

Вопрос или проблема Я создал и проанализировал около 16 моделей машинного обучения, используя WEKA. В данный момент у меня есть CSV-файл, который показывает метрики моделей (такие как percent_correct, F-measure, recall, precision и т.

Data Science

Python: Как построить график временного интервала из DataFrame в Pandas

00

Вопрос или проблема У меня есть датафрейм (df), который содержит данные о выполнении задания в разные временные интервалы. Он включает в себя следующие детали о выполнении задания: Время начала задания (START) Время окончания задания (END) Временной интервал (interval), т.

Вопросы и ответы

Скорректированная цена закрытия от yfinance не совпадает с общим ответом от Yahoo Finance.

01

Вопрос или проблема Я пытаюсь рассчитать месячную и годовую доходность в процентах для фонда, подобного VSMPX. Я понимаю, что скорректированная цена закрытия из yfinance учитывает дробления и дивиденды. Чтобы получить процентную доходность, я делаю следующее

Data Science

удаление столбца с более чем 60% пропущенных значений

00

Вопрос или проблема Как это указано в заголовке, я работаю с набором данных, и в определенном столбце отсутствует около 60% значений. Должен ли я просто удалить этот столбец вместо импутации? Причина заключается в том, что я работаю с набором данных о

Вопросы и ответы

Постоянная ошибка переименования индекса (или это индекс?) в DataFrame pandas

00

Вопрос или проблема Это должно быть просто. У меня есть датафрейм pandas с датой в качестве индекса; это периодический индекс. Когда я строю график данных, легенда упоминает “Series”, в то время как я хочу, чтобы она показывала “

Вопросы и ответы

Пометьте последующие строки после изменения значения в одном столбце, если это основано на условии в столбце B.

00

Вопрос или проблема У меня есть проблема с следующими данными: месяц продукт версия цена категория 1 A alpha 500 foo 2 A alpha 500 foo 3 A alpha 550 foo 4 A alpha 600 bar 5 A alpha 500 bar 6 A alpha 500 faz 7 A alpha 500 faz 8 A alpha 500 faz […]

Вопросы и ответы

Как отобразить стилизованный DataFrame в консоли tkinter

00

Вопрос или проблема Я написал код на языке Python. Предоставленный код представляет собой приложение Python, которое обрабатывает файл Excel и выделяет определенные строки желтым цветом на основе определенных критериев в различных функциях.

Вопросы и ответы

Как выполнять запрос к большому файлу с помощью pandas (или альтернативы)?

00

Вопрос или проблема У меня есть большой файл (6 ГБ, около 17 миллионов строк) с 5 столбцами. Я хочу использовать первый столбец в качестве ключа и извлечь остальные 4 столбца. Я хочу задать несколько ключей. Мой код выглядит так: import pandas as pd df = pd.

Data Science

Как загрузить предварительно обработанные данные .txt и использовать их для обучения сверточных сетей?

00

Вопрос или проблема У меня есть много файлов ‘.txt’ (предварительно обработанных), связанных с C3D, и мне нужно использовать их для обучения и тестирования с использованием модели CNN. Как это сделать? Большая часть данных в каждом .

Вопросы и ответы

Как использовать группировку в Pandas для получения суммы?

00

Вопрос или проблема Я использую этот DataFrame: Фрукты Дата Имя Количество Яблоки 10/6/2016 Боб 7 Яблоки 10/6/2016 Боб 8 Яблоки 10/6/2016 Майк 9 Яблоки 10/7/2016 Стив 10 Яблоки 10/7/2016 Боб 1 Апельсины 10/7/2016 Боб 2 Апельсины 10/6/2016 Том 15 Апельсины

Вопросы и ответы

Как создать простой счетчик “да-нет” (Pandas)?

00

Вопрос или проблема Я пытаюсь создать простой график подсчета, показывающий количество для статистики «да-нет». Однако у меня по оси y значения находятся между 0 и 1, и график не отображает фактическое количество переменной (перемасштабирование оси не помогло).

Data Science

Как создать график конкретной строки с каждым столбцом с помощью Python и какой пакет выбрать: Matplotlib или Seaborn?

00

Вопрос или проблема Я пытаюсь создать график для ранжирования каждой страны с 2002 по 2023 год. Я создал этот набор данных, загрузив каждый файл csv за соответствующий год, который содержит столбцы Страны и Ранжирование, и объединив эти отдельные наборы

Вопросы и ответы

DataFrame.dtypes не работает после astype() в pandas.

00

Вопрос или проблема Я преобразовал столбец OrderDate из существующего типа данных object в ‘datetime64[ns]’ с помощью метода astype. Но после dtypes() я увидел, что это не сработало. Почему? Спасибо. `df_raw.OrderDate.astype(‘

Вопросы и ответы

JSON в DataFrame Pandas с null-значениями и отсутствующими столбцами

00

Вопрос или проблема Я работаю с файлом JSON, который выглядит следующим образом: f = {'results': [{'tables': [{'rows': [{'column1': 'собака', 'column2': 'синий', 'column3': 'грустный'}, { 'column2': 'красный', 'column3': 'счастливый'}, {'column1': 'птица'

Вопросы и ответы

Расширенное многоконтекстное списковое включение

00

Вопрос или проблема Расширенное многоконтекстное списковое включение Я новичок в Python и хотел бы присвоить значение на основе математических операций, например “right”, если >, “left”, если df[col].mean() else "right" if df[col].

Вопросы и ответы

Поиск оставшихся строк в датафреймах pandas

00

Вопрос или проблема Поиск оставшихся строк в датафреймах pandas Если я определяю Y в определенных столбцах, используя это: thing1 = df[df['column1'] == 'Y'] thing2 = df[df['column2'] == 'Y'] thing3 = df[df['column3'] == 'Y'] thing4 = df[df['column4']

Вопросы и ответы

Преобразовать список строк времени в уникальный формат строки

00

Вопрос или проблема Преобразовать список строк времени в уникальный формат строки У меня есть список строк времени с разными форматами, как показано ниже time = ["1:5 am", "1:35 am", "8:1 am", "9:14 am", "14:23 pm", "20:2 pm"] dict = {'time': time} df = pd.

Вопросы и ответы

Определение дублированных групп в pandas

00

Вопрос или проблема Определение дублированных групп в pandas Предположим, у меня есть следующие данные df = pd.DataFrame({ 'task_id': [1, 1, 1, 1, 2, 2, 2, 2], 'job_id': [1, 1, 2, 2, 0, 0, 1, 1], 'filename': ['filename1', 'filename2', 'filename33', 'filename2342'