Data Science
Каков пример нормализации (приведения единичной нормы строки)?
00
Вопрос или проблема Я изучаю концепции стандартизации и нормализации для инженерии признаков. Стандартизация, например, осуществляется с помощью z-оценки, где на основе среднего значения и стандартного отклонения мы пересчитываем значения так, чтобы среднее
Data Science
Следует ли применять нормализацию к признаку взаимодействия
00
Вопрос или проблема Я работаю с взаимодействиями в своей модели машинного обучения, где я создаю новые признаки, умножая числовую переменную на закодированный категориальный признак. Мой вопрос: Следует ли применять нормализацию к этим термам взаимодействия?
Data Science
Какова лучшая практика нормализации/стандартизации несбалансированных данных для обнаружения выбросов или задачи бинарной классификации?
00
Вопрос или проблема Я исследую обнаружение аномалий/выбросов/мошенничества и ищу лучшие практики предобработки синтетических данных для несбалансированных данных. Я проверил все методологии нормализации/стандартизации, которые не чувствительны к наличию
Data Science
Коррекция одного из нескольких сильных батч-эффектов в наборе данных.
00
Вопрос или проблема Мне интересно, какие статистические инструменты использовать при анализе данных, имеющих несколько сильных эффектов партии (распределения варьируются от одной партии к другой). Я хотел бы скорректировать эффект партии, когда он возникает
Data Science
Должен ли масштаб выходных данных соответствовать выходу функции активации?
00
Вопрос или проблема Я создаю LSTM с keras, который имеет параметр activation в слое. Я читал, что масштабирование выходных данных должно соответствовать выходным значениям функции активации. Например, функция активации tanh выдает значения в диапазоне
Data Science
Масштабирование временных рядов данных – по отдельности илиCombined?
00
Вопрос или проблема У меня есть данные о многих автомобилях за время (несколько лет на каждый автомобиль) Я планирую создать модель для всех автомобилей вместе (не одну модель на каждый автомобиль). Хочу ли я нормализовать (привести к стандартному виду)
Data Science
Что значит нормализовать временной ряд по отношению к другому?
00
Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные
Data Science
Нормализация изображений и обратная нормализация: цвета, потерянные при генерации изображений (GAN)
00
Вопрос или проблема Я работаю над GAN. Основываясь на различных статьях, я использую функцию активации Tanh на последнем слое генератора, которая производит выходные данные в диапазоне [-1,1]. Чтобы это было согласованно, я использую нормализацию изображения с помощью cv2: cv2.
Data Science
Подготовка игрового датасета – one-hot-кодирование против min-max-нормализации для идентификаторов карт
00
Вопрос или проблема У меня есть набор данных для игры. 5 карт игроков с идентификаторами для игрока 1, 5 карт игроков с идентификаторами для игрока 2. Имена столбцов выглядят как player1_card1_id, …, player1_card5_id, player2_card1_id, …
Data Science
Как на нормализацию влияют выбросы? И как их избежать?
00
Вопрос или проблема У меня есть набор данных, который сводится к трем столбцам: 1. Название поставщика 2. Количество транзакций с поставщиком 3. Общая стоимость этих транзакций. Я пытаюсь найти лучший способ ранжирования всех поставщиков на основе этих
Data Science
Генерация правильной цели для модели LSTM
00
Вопрос или проблема Пытаюсь объяснить свой вопрос на упрощенном наборе данных. Имея следующий набор данных: день f1 f2 0 0 10 1000 1 1 45 2000 2 2 120 3400 3 3 90 5000 Я пробую два подхода для генерации оценки на основе наблюдений данных: Подход 1: Я
Вопросы и ответы
Попытка сопоставить диапазон значений (положительных и отрицательных) соответствующим значениям в другом диапазоне.
00
Вопрос или проблема Я работаю над ASCII-форматированным тепловым картографом для стола 3D-принтера. У меня есть массив цветов (длиной 107), и сетка стола может иметь широкий спектр значений, которые всегда будут включать отрицательные и положительные значения –
Data Science
Нормализация данных в классификации нестационарных данных с использованием Learn++.NSE на основе MLP
00
Вопрос или проблема Мне нужно предсказать техническое агрегированное состояние, используя данные мониторинга вибраций. Мы считаем эти данные нестационарными, т.е. параметры распределения и описательная статистика не постоянны.