Data Science
Рабочий процесс для итеративного захвата и улучшения моделей машинного обучения
00
Вопрос или проблема Я работаю с несколькими методами машинного обучения (регрессия с использованием опорных векторов, регрессия случайного леса и регрессия KNN через scikit-learn) и хочу узнать, как определить, какой метод наиболее подходящ для использования
Data Science
AttributeError: нормализовать fastai
00
Вопрос или проблема Я пытаюсь использовать fastai для обучения модели, однако получаю эту ошибку, когда пытаюсь нормализовать свои данные, используя статистику imagenet. После некоторых поисков я не могу найти подходящей замены для этой строки. У вас есть решение?
Data Science
Когда я использую линейную регрессию в машинном обучении, выбор переменных аналогичен выбору параметров настройки?
00
Вопрос или проблема Я новичок в машинном обучении. После нескольких дней изучения идей машинного обучения я пришел к некоторым выводам, которые приведены ниже (я рассматриваю только контролируемое обучение). Шаг 1: Разделение данных Перед обработкой данных
Data Science
Как бы я классифицировал эту переменную?
00
Вопрос или проблема Я изучаю разницу между категориальными, порядковыми и числовыми переменными. Из того, что я понял: Категориальные переменные имеют 2 и более категорий без какого-либо внутреннего порядка. Порядковые переменные имеют четкий порядок
Data Science
найти процент > x с r
00
Вопрос или проблема Пытаюсь определить названия стран в моем data.frame, где наиболее распространенный язык не является официальным языком. Мой столбец data.frame называется World. Столбец country.y содержит названия всех стран.
Data Science
Как разделить набор данных на обучающую и тестовую выборки для временных рядов (многократное прогнозирование с несколькими выходами)?
00
Вопрос или проблема Я пытаюсь использовать нейронную сеть LSTM для многошагового / многовыходного прогнозирования (я предсказываю несколько значений за одно время, зная некоторые значения из прошлого). Но я осознал, что должен быть осторожным при разделении
Data Science
Показ стандартного отклонения для кривой обучения
00
Вопрос или проблема Я тренирую нейронную сеть и хотел построить график изменения различных метрик (MSE…) в процессе обучения. Чтобы получить представление о вариациях между разными обучениями, я использую несколько моделей и строю среднее значение и стандартное отклонение.
Data Science
Расчет относительного стандартного отклонения с помощью пользовательской функции в R
00
Вопрос или проблема Я измерил концентрации элементов в ряде образцов. Каждая концентрация является средним значением трех измерений. Также записана стандартная девиация этих измерений. Я пытался рассчитать относительную стандартную девиацию с помощью
Data Science
Токенизация составных и сложносочинённых предложений
00
Вопрос или проблема Я пытаюсь разбить на токены предложения документа для анализа аспектов на основе тональности. Есть некоторые предложения, которые состоят из более чем одной темы. Вот несколько примеров: “Сенсорный экран хороший, но аккумулятор слабый”
Data Science
Улучшение предсказательной способности традиционных индексов сходства узлов с помощью алгоритма Node2Vec
00
Вопрос или проблема Я пытаюсь протестировать возможность улучшения предсказательных способностей традиционных алгоритмов аналогии узлов, таких как коэффициент Жаккара или алгоритм Адамика-Адера, с помощью графовых встраиваний, таких как Node2Vec.
Data Science
Как мы различаем скоррелированные и не скоррелированные характеристики/переменные? Это имеет значение для регрессионного анализа?
00
Вопрос или проблема Коррелированные и некоррелированные термины часто используются в области науки о данных и рассматриваются как если бы они представляли коэффициент корреляции. Это правильный подход? Да! Корреляция между признаками/атрибутами действительно
Data Science
Генерация последовательности на основе значения в другом столбце на Python
00
Вопрос или проблема У меня есть следующий датафрейм: Я хотел бы добавить колонку со значением, равным 1, если flag равен 0, и поэтапно добавлять 1 в последующих строках, пока не встретится следующий 0 (как показано в примере ниже).
Data Science
Train score намного ниже, чем Test score, это нормально?
00
Вопрос или проблема Я работаю с очень несбалансированным набором данных, я использовал SMOTEENN (SMOTE+ENN) для балансировки, следующий тест был проведён с использованием Random Forest Classifier : Мои результаты на обучающей и тестовой выборках до использования
Data Science
Как выполнять многометочное классифицирование текста с использованием глубокого обучения
00
Вопрос или проблема Я новичок в многошаговой текстовой классификации с использованием глубокого обучения. У меня есть данные, подобные этим: parent_pid domain_tld category_dz description_en 0 1000714377 douglas_de Макияж > Лицо >
Data Science
Использование MMD для адаптации доменов (пространство RKHS) с GLM (оригинальное пространство)
00
Вопрос или проблема Я исследую подход, при котором использую Maximum Mean Discrepancy (MMD) для измерения расстояния между двумя доменными наборами данных, а затем использую это расстояние для разделения признаков на два набора: общий и необычный признаки.
Data Science
Прогнозирование относительного распределения между доступными экземплярами
00
Вопрос или проблема Я работаю над моделью, которая должна предсказать, как объем заказов распределяется по доступным товарам в розничной торговле. Для простоты предположим, что я розничный продавец, который покупает яблоки у разных фермеров и поставщиков
Data Science
Прогнозирование недавности-частоты-деньги (RFM) через классификацию характеристик клиентов
00
Вопрос или проблема У меня есть RFM модель, которую я использую для сегментации клиентов на основе RFM оценки. Что я хотел бы сделать: Понять больше о характеристиках моих клиентов, чем просто их RFM оценка; Суметь предсказать, к какому сегменту RFM
Data Science
Имя слоя Keras функционального API не зафиксировано с оберткой TimeDistributed
00
Вопрос или проблема class Net2: @staticmethod def build_cat_branch(inputs,category_size): x = TimeDistributed(Dense(category_size))(inputs) x = Activation('softmax', name="cat_output")(x) return x @staticmethod def build_t_branch(inputs): x = TimeDistributed(Dense(1
Data Science
Прогнозирование продаж на следующий год (не имея тестовых данных)
00
Вопрос или проблема Я новичок в области науки о данных и в настоящее время работаю над проектом по прогнозированию продаж продуктов на предстоящий год. У меня есть исторические данные о продажах для каждого продукта на дневной основе за последние три года. Моя цель –
Data Science
Реверсирование входных и выходных данных алгоритма машинного обучения для оптимизации
00
Вопрос или проблема Мой набор данных состоит из нескольких входных переменных (X) и нескольких выходных переменных (Y). Например: | X1| X2 | X3 | | Y1| Y2 | Y3 | ---------------------------------- | 1 | 1 | 0 | | 2 | 2 | 0 | | 2 | 2 | 1 | | 3 | […]