Data Science
пандас датафрейм ничего не показывает, когда просматривается как датафрейм в PyCharm
00
Вопрос или проблема import pandas as pd; dataSet = pd.read_csv("winequality-red.csv"); dataSet.describe(include="all"); Когда просматриваю набор данных в виде фрейма данных, он показывает пустую таблицу. Но при выводе dataSet я получаю следующий результат. <
Data Science
лучший алгоритм или модель для кластеризации областей на карте?
00
Вопрос или проблема У меня есть база данных, которая содержит информацию, такую как широта, долгота, а также другую информацию, например, достопримечательности, рестораны и торговые центры, сельская местность это или пригород, …
Data Science
Как отсортировать многоуровневый DataFrame в pandas по определённому столбцу?
00
Вопрос или проблема Я хотел бы отсортировать многоиндексный DataFrame pandas по столбцу, но не хочу, чтобы весь DataFrame сортировался сразу. Я предпочел бы отсортировать по одному из индексов. Вот пример того, что я имею в виду: Ниже приведен пример
Data Science
Python 3.11 | Как заставить Python собирать значения определенной ячейки в читаемом файле Excel, ЕСЛИ строка этой ячейки имеет определенное значение в другом столбце.
00
Вопрос или проблема Я совсем новичок в этой части кодирования, связанной со сбором данных, просто пытаюсь немного автоматизировать процесс. В настоящее время у меня есть этот excel файл, который Python читает нормально, однако, я пытаюсь выяснить, как
Data Science
Ошибка при воспроизведении демонстрационной тетради Eland
00
Вопрос или проблема Я пытался воспроизвести блокнот клиента Python Elasticsearch Eland, доступный в документации Eland. Вот первые строки кода для создания eland dataframe из моего локального индекса Elasticsearch под названием sensor_index: import eland
Data Science
Создание функции для записи листов Excel с использованием pandas
00
Вопрос или проблема def CTDataSQ (name): name= cleanDF[[“PatientstudyId2″,”RATER”,”CT_3D”,name]] name= name.loc[name[‘CT_3D’] == 1] del name[“CT_3D”] name.to_excel(name, “
Data Science
Использование Python/Pandas для сравнения столбцов неравной длины
00
Вопрос или проблема https://ibb.co/cyCzVgy Я хотел бы сравнить NEW_PRICE с LINE_TOTAL_ALLOWED на основе PROC_CODE. Идеально, если Pandas начнет с первой строки, сопоставит PROC_CODE и PROC_CODE_NEW, затем вычтет NEW_PRICE из LINE_TOTAL_ALLOWED и выведет
Data Science
Заказ набора данных по материаловедению (названия свойств, скаляры свойств, формулы)
00
Вопрос или проблема Я работаю с набором данных материаловедения и нахожусь в следующей ситуации, У меня есть данные, организованные следующим образом: Chemical_ Formula Property_name Property_Scalar He Electrical conduc. 1 NO_2 Resistance 50 CuO3 Hardness .
Data Science
Как найти аномалии в (почти) постоянном потоке данных?
00
Вопрос или проблема У меня есть процесс, который (проще говоря), запускается каждые 5 минут, собирает данные и записывает эти данные в базу данных. Более подробное объяснение: процесс запускается, собирает данные (что занимает некоторое время) и размещает
Data Science
Как упорядочить значения в разных столбцах в правильном порядке на основе другого фрейма данных (сопоставления) в Python Pandas
00
Вопрос или проблема Я довольно новичок в Python и Pandas и испытываю трудности с объединением неупорядоченного датафрейма из Excel с картой. Я пытался найти решения в Интернете, но безуспешно. Мой первый df_1 выглядит следующим образом: Название продукта
Data Science
Как сравнить и найти общие значения из разных столбцов в одном датафрейме?
00
Вопрос или проблема Я хотел бы сравнить два столбца и найти общие наборы значений в каждом столбце, затем вывести строки с общими значениями. Предположим, у меня есть датафрейм с: no.(col1) | Username (col2) | Referral(col3) | email(col4) 0 | john | mike
Data Science
Эффективно изменить большой csv-файл в Pandas
00
Вопрос или проблема У меня есть CSV-файл, и я хотел бы внести в него следующие изменения: df = pandas.read_csv('some_file.csv') df.index = df.index.map(lambda x: x[:-1]) df.to_csv('some_file.csv') Это убирает последний символ в индексах и сохраняет файл заново.
Data Science
Обновление столбца в pandas DataFrame с использованием функций Apply, Lambda и Group by
00
Вопрос или проблема У меня есть датафрейм в формате, указанном на скриншоте ниже. Столбец ‘Candidate Won‘ имеет значение ‘loss‘ для всех строк. Я хочу обновить столбец ‘Candidate Won’ до значения ‘
Data Science
Рассчитать прогнозируемое значение на основе коэффициента и константы на Python.
00
Вопрос или проблема У меня есть коэффициенты и константа (альфа). Я хочу перемножить и сложить значения, как в этом примере. (это нужно сделать для 300000 строк) Прогноз = константа + (значениеСтроки1 * кол1) + (-значениеСтроки1 * кол2) + (-значениеСтроки1
Data Science
Почему люди предпочитают Pandas, а не SQL?
00
Вопрос или проблема Я использую SQL с 1996 года, так что я могу быть предвзятым. Я активно использовал MySQL и SQLite 3, но также использовал Microsoft SQL Server и Oracle. Подавляющее большинство операций, которые я видел с Pandas, можно сделать легче с помощью SQL.
Data Science
sklearn текстовый анализ – обработка пропущенных значений
00
Вопрос или проблема Я работаю над проектом мульти-классовой текстовой классификации. Моя цель проста: с учетом “баг”, я хочу предсказать, к какому конечному владельцу группы он будет отнесен. Мне удалось собрать ~15000 образцов багов с релевантным статусом (т.
Data Science
Разделение данных на признаки/метки и обучение/тестирование после чтения из csv файла.
00
Вопрос или проблема Мне нужно прочитать данные из файла CSV, а затем разделить эти данные на признаки и метки, а затем на обучающую и тестовую выборку. Однако возникает несколько проблем снова и снова. Ниже приведен код, который я пытался использовать
Data Science
Сравнение объекта датафрейма со строковым значением в Django
00
Вопрос или проблема Я реализую модель машинного обучения и использую обучающую выборку из таблицы MySQL, и все это построено на Django. В основном все вычисления выполняются путем преобразования всех данных из таблицы MySQL в датафрейм.
Data Science
Как удалить объект с плавающей запятой в датафрейме? Например: “зима 2021” на “зима”
00
Вопрос или проблема У меня есть столбец, в котором я хочу удалить год и оставить только сезон. Пример: “зима 2021” станет “зима”. Попробуйте df['Column'] = df['Column'].str.replace('\d+', '') это удалит все цифры в столбце Попробуйте
Data Science
Найдите и посчитайте похожие цены в каждом магазине и выведите максимальное количество и соответствующие строки.
00
Вопрос или проблема Моя цель: для каждого товара в каждом магазине найти количество товаров в том же магазине с разницей в цене в $2 (т.е. количество товаров с похожей ценой в том же магазине). Затем перечислить все товары, у которых наибольшее количество товаров.