Вопросы и ответы
Как отобразить стилизованный DataFrame в консоли tkinter
00
Вопрос или проблема Я написал код на языке Python. Предоставленный код представляет собой приложение Python, которое обрабатывает файл Excel и выделяет определенные строки желтым цветом на основе определенных критериев в различных функциях.
Вопросы и ответы
Как выполнять запрос к большому файлу с помощью pandas (или альтернативы)?
00
Вопрос или проблема У меня есть большой файл (6 ГБ, около 17 миллионов строк) с 5 столбцами. Я хочу использовать первый столбец в качестве ключа и извлечь остальные 4 столбца. Я хочу задать несколько ключей. Мой код выглядит так: import pandas as pd df = pd.
Data Science
Как загрузить предварительно обработанные данные .txt и использовать их для обучения сверточных сетей?
00
Вопрос или проблема У меня есть много файлов ‘.txt’ (предварительно обработанных), связанных с C3D, и мне нужно использовать их для обучения и тестирования с использованием модели CNN. Как это сделать? Большая часть данных в каждом .
Вопросы и ответы
Как использовать группировку в Pandas для получения суммы?
00
Вопрос или проблема Я использую этот DataFrame: Фрукты Дата Имя Количество Яблоки 10/6/2016 Боб 7 Яблоки 10/6/2016 Боб 8 Яблоки 10/6/2016 Майк 9 Яблоки 10/7/2016 Стив 10 Яблоки 10/7/2016 Боб 1 Апельсины 10/7/2016 Боб 2 Апельсины 10/6/2016 Том 15 Апельсины
Вопросы и ответы
Как создать простой счетчик “да-нет” (Pandas)?
00
Вопрос или проблема Я пытаюсь создать простой график подсчета, показывающий количество для статистики «да-нет». Однако у меня по оси y значения находятся между 0 и 1, и график не отображает фактическое количество переменной (перемасштабирование оси не помогло).
Data Science
Как создать график конкретной строки с каждым столбцом с помощью Python и какой пакет выбрать: Matplotlib или Seaborn?
00
Вопрос или проблема Я пытаюсь создать график для ранжирования каждой страны с 2002 по 2023 год. Я создал этот набор данных, загрузив каждый файл csv за соответствующий год, который содержит столбцы Страны и Ранжирование, и объединив эти отдельные наборы
Вопросы и ответы
DataFrame.dtypes не работает после astype() в pandas.
00
Вопрос или проблема Я преобразовал столбец OrderDate из существующего типа данных object в ‘datetime64[ns]’ с помощью метода astype. Но после dtypes() я увидел, что это не сработало. Почему? Спасибо. `df_raw.OrderDate.astype(‘
Вопросы и ответы
JSON в DataFrame Pandas с null-значениями и отсутствующими столбцами
00
Вопрос или проблема Я работаю с файлом JSON, который выглядит следующим образом: f = {'results': [{'tables': [{'rows': [{'column1': 'собака', 'column2': 'синий', 'column3': 'грустный'}, { 'column2': 'красный', 'column3': 'счастливый'}, {'column1': 'птица'
Вопросы и ответы
Расширенное многоконтекстное списковое включение
00
Вопрос или проблема Расширенное многоконтекстное списковое включение Я новичок в Python и хотел бы присвоить значение на основе математических операций, например “right”, если >, “left”, если df[col].mean() else "right" if df[col].
Вопросы и ответы
Поиск оставшихся строк в датафреймах pandas
00
Вопрос или проблема Поиск оставшихся строк в датафреймах pandas Если я определяю Y в определенных столбцах, используя это: thing1 = df[df['column1'] == 'Y'] thing2 = df[df['column2'] == 'Y'] thing3 = df[df['column3'] == 'Y'] thing4 = df[df['column4']
Вопросы и ответы
Преобразовать список строк времени в уникальный формат строки
00
Вопрос или проблема Преобразовать список строк времени в уникальный формат строки У меня есть список строк времени с разными форматами, как показано ниже time = ["1:5 am", "1:35 am", "8:1 am", "9:14 am", "14:23 pm", "20:2 pm"] dict = {'time': time} df = pd.
Вопросы и ответы
Определение дублированных групп в pandas
00
Вопрос или проблема Определение дублированных групп в pandas Предположим, у меня есть следующие данные df = pd.DataFrame({ 'task_id': [1, 1, 1, 1, 2, 2, 2, 2], 'job_id': [1, 1, 2, 2, 0, 0, 1, 1], 'filename': ['filename1', 'filename2', 'filename33', 'filename2342'
Вопросы и ответы
Как посчитать пустые и заполненные ячейки в каждом столбце файла .csv?
00
Вопрос или проблема Как посчитать пустые и заполненные ячейки в каждом столбце файла .csv? Я хочу посчитать заполненные и пустые ячейки в каждом столбце .csv файла. Вот мой код: import pandas as pd file_path = r"C:\Users\andre\OneDrive\Documentos\Farmácia\Python\Cadastro_clientes\cadastro_cli.
Вопросы и ответы
Как лучше всего связать предсказания с исходными наблюдениями тестового набора, используя Pandas и sklearn?
00
Вопрос или проблема У меня есть данные в следующем формате: цель признак 1 признак 2 признак 3 поле 1 поле 2 поле 3 Я моделирую, используя регрессию лассо в sklearn.linear_model. Поля 1, 2 и 3 исключаются перед моделированием, так как они не являются
Вопросы и ответы
Категориальный тип данных
00
Вопрос или проблема Почему в: cat = pd.Categorical( values=['a', 'b', 'd', 'f'], categories=['b', 'a', 'c', 'd', 'e', 'f'], ordered=True ) cat.dtype Вывод Dtype – это ‘object’, а не ‘category’. CategoricalDtype(categories=['b'
Вопросы и ответы
Как выбрать максимальное значение в каждой строке в Pandas
00
Вопрос или проблема У меня есть этот дата-фрейм: Server 1-Jun 6-Jun 1-jul Jul-10 ServerA 8 9 5 90 ServerB 100 10 9 90 Мне нужно создать еще один столбец под названием maximumval и выбрать максимальное значение за все месяцы для каждого сервера: Получившийся
Вопросы и ответы
Функция биндинга, отображающая значения ‘none’ вместо заданных значений в Pandas [дубликат]
00
Вопрос или проблема У этого вопроса уже есть ответы здесь: Как разбить столбец с числами с плавающей запятой на группы с помощью pandas (2 ответа) Какова цель оператора return? Чем он отличается от вывода на экран? (15 ответов) Закрыто 15 минут назад.
Вопросы и ответы
Защита паролем файла Excel (.xlsx) с помощью Python в Databricks
00
Вопрос или проблема Я хочу защитить Excel файл паролем, который доступен в S3 бакете, и сохранить его обратно в S3. Я попытался сделать это с помощью openpyxl и xlsxwriter, они создают xlsx файл, но он открывается без запроса пароля.
Вопросы и ответы
Сложные операции с pandas: сортировка, фильтрация, условная нумерация и настраиваемая сортировка
00
Вопрос или проблема У меня есть очень большой файл Excel, который содержит много данных, которые мне нужно обработать. Обычно я делаю это в Excel, но это заняло бы у меня часы, и я знаю, что Pandas справляется с этим за считанные секунды. Первая колонка “
Вопросы и ответы
Более эффективный способ создания нового столбца в DataFrame с использованием фильтрации на основе строк без применения iterrows()
00
Вопрос или проблема У меня есть функция, которую я упрощаю ниже, но которую я использую для создания нового столбца в существующем датафрейме. В настоящее время я использую iterrows, но я пытался использовать .apply, фильтруя по уникальным группам Года