pandas
Вопросы и ответы
Вопрос или проблема Я экспортирую таблицу из базы данных в pandas dataframe и пытаюсь применить маску формата для очистки некоторого текста свободного формата, содержащегося в одном из столбцов. Я хочу создать новый столбец в dataframe, чтобы извлечь
Data Science
Вопрос или проблема У меня есть множество категориальных данных, относящихся к частям речи, которые я хочу свести к меньшему числу категорий. np.where() не подойдет, потому что я хочу в итоге получить 6 категорий: существительное, глагол, прилагательное
Data Science
Вопрос или проблема Я создал и проанализировал около 16 моделей машинного обучения, используя WEKA. В данный момент у меня есть CSV-файл, который показывает метрики моделей (такие как percent_correct, F-measure, recall, precision и т.
Data Science
Вопрос или проблема У меня есть датафрейм (df), который содержит данные о выполнении задания в разные временные интервалы. Он включает в себя следующие детали о выполнении задания: Время начала задания (START) Время окончания задания (END) Временной интервал (interval), т.
Вопросы и ответы
Вопрос или проблема Я пытаюсь рассчитать месячную и годовую доходность в процентах для фонда, подобного VSMPX. Я понимаю, что скорректированная цена закрытия из yfinance учитывает дробления и дивиденды. Чтобы получить процентную доходность, я делаю следующее
Data Science
Вопрос или проблема Как это указано в заголовке, я работаю с набором данных, и в определенном столбце отсутствует около 60% значений. Должен ли я просто удалить этот столбец вместо импутации? Причина заключается в том, что я работаю с набором данных о
Вопросы и ответы
Вопрос или проблема Это должно быть просто. У меня есть датафрейм pandas с датой в качестве индекса; это периодический индекс. Когда я строю график данных, легенда упоминает “Series”, в то время как я хочу, чтобы она показывала “
Вопросы и ответы
Вопрос или проблема У меня есть проблема с следующими данными: месяц продукт версия цена категория 1 A alpha 500 foo 2 A alpha 500 foo 3 A alpha 550 foo 4 A alpha 600 bar 5 A alpha 500 bar 6 A alpha 500 faz 7 A alpha 500 faz 8 A alpha 500 faz […]
Вопросы и ответы
Вопрос или проблема Я написал код на языке Python. Предоставленный код представляет собой приложение Python, которое обрабатывает файл Excel и выделяет определенные строки желтым цветом на основе определенных критериев в различных функциях.
Вопросы и ответы
Вопрос или проблема У меня есть большой файл (6 ГБ, около 17 миллионов строк) с 5 столбцами. Я хочу использовать первый столбец в качестве ключа и извлечь остальные 4 столбца. Я хочу задать несколько ключей. Мой код выглядит так: import pandas as pd df = pd.
Data Science
Вопрос или проблема У меня есть много файлов ‘.txt’ (предварительно обработанных), связанных с C3D, и мне нужно использовать их для обучения и тестирования с использованием модели CNN. Как это сделать? Большая часть данных в каждом .
Вопросы и ответы
Вопрос или проблема Я использую этот DataFrame: Фрукты Дата Имя Количество Яблоки 10/6/2016 Боб 7 Яблоки 10/6/2016 Боб 8 Яблоки 10/6/2016 Майк 9 Яблоки 10/7/2016 Стив 10 Яблоки 10/7/2016 Боб 1 Апельсины 10/7/2016 Боб 2 Апельсины 10/6/2016 Том 15 Апельсины
Вопросы и ответы
Вопрос или проблема Я пытаюсь создать простой график подсчета, показывающий количество для статистики «да-нет». Однако у меня по оси y значения находятся между 0 и 1, и график не отображает фактическое количество переменной (перемасштабирование оси не помогло).
Data Science
Вопрос или проблема Я пытаюсь создать график для ранжирования каждой страны с 2002 по 2023 год. Я создал этот набор данных, загрузив каждый файл csv за соответствующий год, который содержит столбцы Страны и Ранжирование, и объединив эти отдельные наборы
Вопросы и ответы
Вопрос или проблема Я преобразовал столбец OrderDate из существующего типа данных object в ‘datetime64[ns]’ с помощью метода astype. Но после dtypes() я увидел, что это не сработало. Почему? Спасибо. `df_raw.OrderDate.astype(‘
Вопросы и ответы
Вопрос или проблема Я работаю с файлом JSON, который выглядит следующим образом: f = {'results': [{'tables': [{'rows': [{'column1': 'собака', 'column2': 'синий', 'column3': 'грустный'}, { 'column2': 'красный', 'column3': 'счастливый'}, {'column1': 'птица'
Вопросы и ответы
Вопрос или проблема Расширенное многоконтекстное списковое включение Я новичок в Python и хотел бы присвоить значение на основе математических операций, например “right”, если >, “left”, если df[col].mean() else "right" if df[col].
Вопросы и ответы
Вопрос или проблема Поиск оставшихся строк в датафреймах pandas Если я определяю Y в определенных столбцах, используя это: thing1 = df[df['column1'] == 'Y'] thing2 = df[df['column2'] == 'Y'] thing3 = df[df['column3'] == 'Y'] thing4 = df[df['column4']
Вопросы и ответы
Вопрос или проблема Преобразовать список строк времени в уникальный формат строки У меня есть список строк времени с разными форматами, как показано ниже time = ["1:5 am", "1:35 am", "8:1 am", "9:14 am", "14:23 pm", "20:2 pm"] dict = {'time': time} df = pd.
Вопросы и ответы
Вопрос или проблема Определение дублированных групп в pandas Предположим, у меня есть следующие данные df = pd.DataFrame({ 'task_id': [1, 1, 1, 1, 2, 2, 2, 2], 'job_id': [1, 1, 2, 2, 0, 0, 1, 1], 'filename': ['filename1', 'filename2', 'filename33', 'filename2342'