preprocessing - ответы на вопросы - Page 2 of 3

Data Science

Как произвести биннинг/токенизацию амплитуды стационарного временного ряда?

00

Вопрос или проблема Я хочу подать амплитуду стационарных временных рядов в трансформер. Я планирую токенизировать/разбить амплитуду на дискретные значения. Таким образом, трансформер будет обучаться на уникальных целых токенах вместо непрерывных значений.

Data Science

Существует ли способ сохранить выбор после изменения предобработки?

00

Вопрос или проблема Я работаю с гиперспектральными изображениями (.hdr или .tab) в программном обеспечении ORANGE DATA MINING v3.37. Для изображений я выбираю область, провожу предварительную обработку и выбираю ROI. Я хочу узнать, есть ли способ изменить

Data Science

Переобучение в сиамской нейронной сети, связанное с проверкой подписей

00

Вопрос или проблема Я работаю над задачей верификации подписей, где мне нужно создать модель, которая даст среднюю достаточно хорошую точность валидации, чтобы получить полезную модель для тестирования (цель – выше 80%).

Data Science

Следует ли применять нормализацию к признаку взаимодействия

00

Вопрос или проблема Я работаю с взаимодействиями в своей модели машинного обучения, где я создаю новые признаки, умножая числовую переменную на закодированный категориальный признак. Мой вопрос: Следует ли применять нормализацию к этим термам взаимодействия?

Data Science

Коррекция одного из нескольких сильных батч-эффектов в наборе данных.

00

Вопрос или проблема Мне интересно, какие статистические инструменты использовать при анализе данных, имеющих несколько сильных эффектов партии (распределения варьируются от одной партии к другой). Я хотел бы скорректировать эффект партии, когда он возникает

Data Science

Как предварительно обрабатывать/кодировать категориальные данные для использования в алгоритмах снижения размерности и кластеризации?

00

Вопрос или проблема Я работаю над проектом, цель которого состоит в кластеризации участников опроса в зависимости от их ответов. Набор данных состоит из 63 вопросов, некоторые из которых номинальные, а некоторые – порядковые.

Data Science

Однократное кодирование в качестве входа для рекуррентных нейронных сетей

00

Вопрос или проблема Я пытаюсь предсказать следующую метку в шаблоне на основе предыдущих меток, используя рекуррентную нейронную сеть. У меня в общей сложности 100 меток. Пример входного шаблона: 1) апельсин, яблоко, банан, лимон ->

Data Science

Порядок трансформации и импутации

00

Вопрос или проблема Я предварительно обрабатываю свои данные для использования в модели линейной регрессии. Мои признаки сильно искажены, и я хотел бы применить трансформацию Йео-Джонсона к некоторым из моих признаков, а логарифмическую трансформацию к другим.

Data Science

Прогнозирование временных рядов для продаж в нескольких магазинах с одновременными временными метками

00

Вопрос или проблема У меня есть набор данных по продажам, в котором каждый магазин имеет уникальный идентификатор. Набор данных содержит ежедневные данные о продажах для каждого магазина за период около двух лет. Я хочу построить модель прогнозирования

Data Science

Порядок предварительной обработки, избегание утечек и метрики

00

Вопрос или проблема У меня есть набор данных с ~40k записей и 16 столбцами (включая целевой) и я хочу понять правильный процесс всего процессаData Science. Вот что я сделал: Провел EDA, в результате чего я удалил два столбца, так как они были сосредоточены

Data Science

Масштабирование временных рядов данных – по отдельности илиCombined?

00

Вопрос или проблема У меня есть данные о многих автомобилях за время (несколько лет на каждый автомобиль) Я планирую создать модель для всех автомобилей вместе (не одну модель на каждый автомобиль). Хочу ли я нормализовать (привести к стандартному виду)

Data Science

Как использовать дифференциальную энтропию в качестве предварительной обработки?

00

Вопрос или проблема В настоящее время я работаю над реализацией модели EEG_DMNet. Для предварительной обработки требуется использование дифференциальной энтропии, как $$ h(X) = -\int_{-\infty}^{\infty} p(x) \log p(x) \, dx $$ Предполагая, что данные

Data Science

Как объединить два временно зависимых набора данных?

00

Вопрос или проблема Я совершенно новый в области науки о данных, так что, пожалуйста, будьте снисходительны. У меня есть набор данных, который содержит записи о случаях возникновения пожаров за последние 35 лет (+-700.000 строк).

Data Science

Лог-преобразование и выбросы

00

Вопрос или проблема Я применяю логарифмическое преобразование ко всем переменным, которые, кажется, имеют выбросы (на основе боксплотов). Мой вопрос: если у меня есть переменная, например, ‘Возраст’, где есть значения выше 100, и я выполняю

Data Science

Предварительная обработка изображений данных перед обучением OneClassSVM и уменьшение количества признаков.

00

Вопрос или проблема Я хочу обучить OneClassSVM() с помощью sklearn, и у меня есть набор из около 800 изображений в тренировочном наборе. Я использую opencv для чтения изображений и изменения их размера до постоянных размеров (960×

Data Science

Заполнение созданной функции значениями

00

Вопрос или проблема Я пытаюсь улучшить точность. Я создал несколько новых признаков на основе старых признаков. Поэтому мне нужно заполнить пустые ячейки новых признаков одинаковыми значениями, чтобы уравнять формы. Затем я попробовал это с медианой

Data Science

ValueError: (‘Истинное значение серии не однозначно после применения условия if/else в датафреймах Pandas

00

Вопрос или проблема Я хочу создать новую переменную для датафрейма details, названную lower, после итерации по нескольким data frames. list1 – это список строковых значений столбца с именем variable_name в details. vars_df –

Data Science

Прогнозирование с помощью алгоритма машинного обучения

00

Вопрос или проблема Извините, если это слишком общий вопрос, но я застрял где-то между идеальным и адекватным в моей модели. Поэтому я хотел бы спросить здесь. Если это не подходящий вопрос, ваши негативные отзывы тоже приветствуются, извините.

Data Science

разный диапазон целевых значений в нейронной сети

00

Вопрос или проблема Я работаю над кодом регрессии с использованием нейронной сети. Набор данных включает 14 признаков в диапазоне значений от -1 до 1, в то время как целевая переменная изменяется от (0.000759) до (1100). Целевые значения масштабируются тремя методами.

Data Science

Сглаживание целевой переменной

00

Вопрос или проблема Я тренирую регрессионную модель (используя лес регрессии с квантилами) для прогнозирования отклонений урожайности от тренда (остатков) с использованием погодных переменных с разными временными задержками. Пытаясь улучшить точность