normalization
Data Science
Вопрос или проблема Я изучаю концепции стандартизации и нормализации для инженерии признаков. Стандартизация, например, осуществляется с помощью z-оценки, где на основе среднего значения и стандартного отклонения мы пересчитываем значения так, чтобы среднее
Data Science
Вопрос или проблема Я работаю с взаимодействиями в своей модели машинного обучения, где я создаю новые признаки, умножая числовую переменную на закодированный категориальный признак. Мой вопрос: Следует ли применять нормализацию к этим термам взаимодействия?
Data Science
Вопрос или проблема Я исследую обнаружение аномалий/выбросов/мошенничества и ищу лучшие практики предобработки синтетических данных для несбалансированных данных. Я проверил все методологии нормализации/стандартизации, которые не чувствительны к наличию
Data Science
Вопрос или проблема Мне интересно, какие статистические инструменты использовать при анализе данных, имеющих несколько сильных эффектов партии (распределения варьируются от одной партии к другой). Я хотел бы скорректировать эффект партии, когда он возникает
Data Science
Вопрос или проблема Я создаю LSTM с keras, который имеет параметр activation в слое. Я читал, что масштабирование выходных данных должно соответствовать выходным значениям функции активации. Например, функция активации tanh выдает значения в диапазоне
Data Science
Вопрос или проблема У меня есть данные о многих автомобилях за время (несколько лет на каждый автомобиль) Я планирую создать модель для всех автомобилей вместе (не одну модель на каждый автомобиль). Хочу ли я нормализовать (привести к стандартному виду)
Data Science
Вопрос или проблема Я рассматриваю способы уменьшения размерностей многомерного набора данных до одномерных сигналов. Но сначала нужно провести некоторую предобработку. Кто-то упомянул, что мне следует объединить сигналы, сначала нормализовав временные
Data Science
Вопрос или проблема Я работаю над GAN. Основываясь на различных статьях, я использую функцию активации Tanh на последнем слое генератора, которая производит выходные данные в диапазоне [-1,1]. Чтобы это было согласованно, я использую нормализацию изображения с помощью cv2: cv2.
Data Science
Вопрос или проблема У меня есть набор данных для игры. 5 карт игроков с идентификаторами для игрока 1, 5 карт игроков с идентификаторами для игрока 2. Имена столбцов выглядят как player1_card1_id, …, player1_card5_id, player2_card1_id, …
Data Science
Вопрос или проблема У меня есть набор данных, который сводится к трем столбцам: 1. Название поставщика 2. Количество транзакций с поставщиком 3. Общая стоимость этих транзакций. Я пытаюсь найти лучший способ ранжирования всех поставщиков на основе этих
Data Science
Вопрос или проблема Пытаюсь объяснить свой вопрос на упрощенном наборе данных. Имея следующий набор данных: день f1 f2 0 0 10 1000 1 1 45 2000 2 2 120 3400 3 3 90 5000 Я пробую два подхода для генерации оценки на основе наблюдений данных: Подход 1: Я
Вопросы и ответы
Вопрос или проблема Я работаю над ASCII-форматированным тепловым картографом для стола 3D-принтера. У меня есть массив цветов (длиной 107), и сетка стола может иметь широкий спектр значений, которые всегда будут включать отрицательные и положительные значения –
Data Science
Нормализация данных в классификации нестационарных данных с использованием Learn++.NSE на основе MLP
Вопрос или проблема Мне нужно предсказать техническое агрегированное состояние, используя данные мониторинга вибраций. Мы считаем эти данные нестационарными, т.е. параметры распределения и описательная статистика не постоянны.