Data Science
Как реорганизовать мой набор данных для улучшения интерпретируемости без потери производительности?
00
Вопрос или проблема Что я делаю: Я предсказываю рейтинги продуктов с использованием бустинговых деревьев (XGBoost) с набором данных в следующем формате: Что я хочу сделать: Я хочу использовать SHAP TreeExplainer, чтобы интерпретировать каждое предсказание
Data Science
Как подойти к проблеме прогнозирования данных
00
Вопрос или проблема Я новичок в машинном обучении и науке о данных. Мне бы очень хотелось получить совет на высоком уровне, как подойти к следующей задаче. Мне нужно предсказать, откажет ли двигатель, у меня есть датчик, который дает определенное значение
Data Science
Как кластеризовать на основе данных сенсоров? – Моя первая работа в области Data Science
00
Вопрос или проблема Я на своей первой (настоящей) работе в области данных и программирования. Как все могут себе представить, это может быть довольно сложно, и я много учусь, учитывая, что я студент по специальности «Наука о данных» в университете.
Data Science
Входные данные Keras для многовариантной классификации с LSTM, используя текущие характеристики и характеристики предыдущих временных шагов и значения y.
00
Вопрос или проблема Я работаю над задачей многомерной бинарной классификации. Я хочу предсказать бинарную классификацию, учитывая признаки в текущий момент времени и данные (признаки + реальная классификация) из предыдущих моментов времени.
Data Science
Как использовать скрытые марковские модели для предсказания непрерывных значений
00
Вопрос или проблема У меня есть некоторые временные ряды, которые мне нужно использовать для прогноза непрерывного значения для данной временной метки. Изначально я использовал многомерную регрессионную модель, но позднее понял, что проблему, основанную
Data Science
Как использовать свежие данные, когда период предсказания цели длительный?
00
Вопрос или проблема Я использую обучение с учителем на данных о ежемесячной активности, чтобы предсказать, когда клиент купит конкретный продукт. Этот продукт обычно покупается редко, и в данный момент моя целевая переменная –
Data Science
Как определить новых потенциальных клиентов на основе профиля существующих клиентов?
00
Вопрос или проблема У меня есть фирмографические данные всех возможных клиентов. Данные включают продажи, прибыльность, капитал, размер организации, географическое расположение, отрасль и т.д. Каков лучший способ выявить новых потенциальных клиентов на основе этих данных?
Data Science
Каковы лучшие практики (современные решения) для определения, является ли ML-модель переобученной, недообученной или хорошо подогнанной (без диагностики плохой подгонки)?
00
Вопрос или проблема Я исследую несколько моделей машинного обучения для задачи прогнозирования на обучающем наборе. Мне интересно, есть ли простой способ определить/обнаружить хорошее/плохое обучение. Классический подход, как он используется для глубокого
Data Science
Как использовать будущие праздничные/акционные дни в качестве входных данных для многомерного LSTM-прогнозирования продаж
02
Вопрос или проблема Я строю прогноз с помощью LSTM в tensorflow 2. Мои данные состоят из 7 колонок: дата (ежедневно), валовые продажи (целевая переменная), ежедневные общие запасы, средняя стоимость заказа, ежедневное количество новых клиентов, является
Data Science
Модель для предсказания продолжительности на основе категориальных данных
00
Вопрос или проблема Я работаю над моделью, которая позволит мне предсказать, сколько времени потребуется для завершения “работы”, основываясь на исторических данных. Каждая работа имеет несколько категориальных характеристик (все независимы)
Data Science
Сравнение вероятностей двух моделей
00
Вопрос или проблема Рассмотрим набор данных и два бинарных класса CLASS_A и CLASS_B. Предположим, что мы обучаем модель, такую как XGBClassifier, для обоих классов (отдельно) и получаем две модели: MODEL_A для предсказания CLASS_A и MODEL_B для предсказания CLASS_B.
Data Science
Интерпретация предсказанных вероятностей после ребалансировки
00
Вопрос или проблема Рассмотрим ситуацию, в которой у меня есть несбалансированный набор данных, где целевой класс принимает значение = 1 в 0,01% наблюдений и значение = 0 в 99,9% наблюдений. Я обучаю модель классификации, скажем, XGBClassifier и получаю
Data Science
Лучша́я прогно́зная модель для объёмов страховых полисов
00
Вопрос или проблема Я новичок в прогнозировании, и изучаю набор данных из страховой компании, который содержит объем новых полисов, продлений и отмен на ежемесячной основе. Новые полисы данного месяца продлеваются через определенные интервалы (3 месяца
Data Science
Регрессия нейронной сети с отрицательной производительностью
00
Вопрос или проблема У меня есть проблема с производительностью многослойного перцептрона-регрессора (нейронной сети), и я не могу понять, почему. Задача: Я пытаюсь улучшить прогноз времени. У меня есть прогнозы физического параметра за последние 4 года
Data Science
Как я могу создать модель для предложения следующего блюда человека?
00
Вопрос или проблема Я новичок в машинном обучении и пытаюсь придумать способ создать модель, которая может предложить пользователю, должен ли его следующий прием пищи быть здоровым или нездоровым. Например, пользователь может установить цель: “
Data Science
Лучший способ оценить производительность в моем случае
00
Вопрос или проблема У меня есть набор данных, который выглядит так F1 F2 F3 F4 F5 F6 A1 A2 A3 1 0 0 0 4 3 X X X 0 3 9 0 0 0 X A X 0 0 0 0 1 0 X X X 0 0 3 2 0 0 X X […]
Data Science
Как измерить влияние Covid, анализируя транзакции по кредитным картам клиентов.
00
Вопрос или проблема Я хочу знать, как можно определить, находится ли клиент в финансовом затруднении из-за ситуации с COVID, используя его транзакции по кредитной карте. У меня есть ежедневные транзакции клиентов до текущей даты.
Data Science
Рейтинг банкоматов на основе использования и экономических данных (Модель оценки/рейтинга)
00
Вопрос или проблема У меня есть образец данных о расположении около 10 банкоматов, а также их количестве использования (внесения наличных, снятия наличных и других операций) за последние 3 месяца. Я планирую собрать дополнительные данные, такие как ближайшие
Data Science
Кросс-эластичность спроса с логистической регрессией
00
Вопрос или проблема Первый пост, будьте добры 😁 Я пытаюсь рассчитать кросс-эластичность спроса. Основная экономическая концепция проста, но при попытке реализовать её я вижу множество различных методов/равнений, которые дают разные результаты.
Data Science
Прогнозирование будущих продаж автомобилей
00
Вопрос или проблема Я новичок в области машинного обучения. В последнее время я стараюсь создать модель, чтобы прогнозировать продажи определенной марки и модели автомобиля у дилера и местоположение, где они будут проданы. Данные, которые мне предоставили