Data Science
Какие данные я должен сохранить в переменной “input_data”?
00
Вопрос или проблема Мне нужно передать предварительно обработанный ввод в модель TFLite для получения выводов. У меня есть Excel-файл с данными и файл модели tensorflowlite. Я получил инструкции о том, как это сделать; вот что у меня есть на данный момент
Вопросы и ответы
не соответствует ни одному известному типу
00
Вопрос или проблема Я получаю это предупреждение, когда пытаюсь вызвать метод Python. Я не импортирую numpy в своем коде. /home/oracle/python/lib/python3.12/site-packages/numpy-2.1.3-py3.12-linux-x86_64.egg/numpy/_core/getlimits.
Data Science
измерение дисперсии различий между двумя наборами соответствующих средних с учетом значимости
00
Вопрос или проблема У меня есть датафрейм id, w, x, y1, y2 (две категориальные переменные, две зависимые переменные) id – это индекс, который не является особенно информативным w, x – категориальные переменные –
Data Science
Как я могу заменить значения NaN на другие значения в столбце CustomerID, если у них одинаковый InvoiceNo?
00
Вопрос или проблема Номер счета Код товара Количество Дата счета Цена за единицу Идентификатор клиента Страна 573415 23434 20 2011-10-30 16:17:00 0.79 13607.0 Великобритания :——– :——— :—
Вопросы и ответы
ПодсчетOccurrences каждого типа события в пределах временного окна в Pandas
00
Вопрос или проблема У меня есть DataFrame со следующей структурой: event_timestamp: временная метка каждого события. event_type: тип события. Мне нужно добавить колонку для каждого уникального event_type, чтобы посчитать, сколько событий этого type произошло
Data Science
График временных рядов с использованием данных netcdf в Python
01
Вопрос или проблема Я пытаюсь построить временной ряд для 3D-графика. Я знаю, что переменную нужно сделать одномерной, чтобы она подходила для графика временного ряда. На самом деле мне нужны данные в пределах бокса с широтой и долготой.
Вопросы и ответы
извлечь первую последовательность чисел из столбца pandas
00
Вопрос или проблема Я импортировал CSV в DataFrame pandas; однако столбец, который мне нужно использовать, имеет свободный формат и находится в плохом состоянии. Мне нужно извлечь первую серию цифр после слова NBU или первую серию цифр в строке.
Data Science
Azure Cloud SQL – Запрос большого количества строк с помощью Python
00
Вопрос или проблема У меня есть приложение на Python Flask, которое подключается к базе данных Azure Cloud SQL и использует метод Pandas read_sql с SQLAlchemy для выполнения операции выбора из таблицы и загрузки данных в dataframe.
Data Science
Заменить пропущенные значения на наиболее частое число при условии
00
Вопрос или проблема Я пытаюсь заменить недостающие значения в столбце “Age”, но с учетом других столбцов в этих данных Titanic – Машинное обучение на основе катастрофы df.Age[(df['Sex'] == 0) & (df['Pclass'] == 1)] Я пытался сделать
Вопросы и ответы
проблемы производительности использования lambda для присвоения переменных в pandas в цепочке методов
00
Вопрос или проблема Когда я работаю с dataframe в pandas, мне нравится использовать цепочки методов, потому что это делает рабочий процесс похожим на подход tidyverse в R, где вы используете строку пайпов. Рассмотрим пример из этого ответа: N = 10 df = ( pd.
Вопросы и ответы
Как добавить строку для отсортированного многоиндексного датафрейма?
00
Вопрос или проблема У меня есть multiindex dataframe, который получается из groupby. Вот демонстрация: In [54]: df = pd.DataFrame({'color': ['blue', 'grey', 'blue', 'grey', 'black'], 'name': ['pen', 'pen', 'pencil', 'pencil', 'box'],'price':[2.
Вопросы и ответы
Интерполяция данных емкости батареи в логарифмической шкале с использованием Python
00
Вопрос или проблема Я работаю над интерполяцией данных емкости батареи на основе взаимосвязей между hour_rates, capacities и currents. Вот образец моих данных: import numpy as np import pandas as pd from scipy.interpolate import interp1d import matplotlib.
Вопросы и ответы
Разделите столбец списков Pandas на несколько столбцов
00
Вопрос или проблема У меня есть DataFrame Pandas с одним столбцом: import pandas as pd df = pd.DataFrame({"teams": [["SF", "NYG"] for _ in range(7)]}) teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] 5 [SF, NYG] 6 [SF, NYG] Как можно
Вопросы и ответы
Сравнение двух колонок дат, чтобы указать, произошло ли событие после другого.
00
Вопрос или проблема У меня есть датафрейм, в котором я хочу вернуть количество (долю) пациентов, которые прошли последующий осмотр после диагноза заболевания. Исходный ДФ (пример 1 пациента) | patient_id | app_date | diag_date | cancer_yn | |------------|------------|------------|-----------|
Data Science
Подсчет значений из разных столбцов
00
Вопрос или проблема Я работаю с dataframe pandas, который содержит такие столбцы: Col1 Col2 Col3 Col4 Да Нет Возможно Не уверен Возможно Да Нет Нет Да Я пытаюсь подсчитать значения в каждом столбце, а затем сложить их, чтобы получить общие количества этих значений.
Data Science
Сравнить несколько значений из DataFrame с одной строкой из другого.
00
Вопрос или проблема Я пытаюсь сравнить значения адресов на предмет неточностей, например, данные по нескольким записям, как показано ниже: Ссылка Квартира Адрес Почтовый индекс AS097 NaN 00 Name Road BH1 4HB AS097 Квартира 1 Название здания 00 Name Road
Data Science
Прогнозирование временных рядов для продаж в нескольких магазинах с одновременными временными метками
00
Вопрос или проблема У меня есть набор данных по продажам, в котором каждый магазин имеет уникальный идентификатор. Набор данных содержит ежедневные данные о продажах для каждого магазина за период около двух лет. Я хочу построить модель прогнозирования
Data Science
Сократите длину данных для эффективного обучения.
00
Вопрос или проблема У меня есть данные о покупках клиентов, в которых каждая строка указывает на товар, купленный клиентом. Проблема в том, что даже если клиент одновременно покупает пять товаров, то для этого будет пять разных строк, и в результате общее
Data Science
Память RAM崩溃 для функции преобразования XML в DataFrame
00
Вопрос или проблема Я создал следующую функцию, которая преобразует XML файл в DataFrame. Эта функция хорошо работает для файлов размером менее 1 ГБ, для всего, что больше этого, память (13 ГБ в Google Colab) выдает ошибку. То же самое происходит, если
Вопросы и ответы
Datacamp: Образец практического экзамена для инженера по данным (HappyPaws)
00
Вопрос или проблема В настоящее время я работаю над задачей очистки данных, где мне нужно объединить три набора данных, связанные с активностью домашних животных, медицинскими записями и информацией о владельцах. Цель состоит в том, чтобы создать единственный