predictive-modeling
Data Science
Вопрос или проблема У меня есть два “образца”. Первый состоит примерно из 400 физических измерений величины (взятых за один час, и реальная ситуация не является стационарной). Они показывают сильно скошенное распределение, для которого теоретическая
Data Science
Вопрос или проблема Я пытаюсь выполнить семантическую сегментацию изображений с помощью TensorFlow. Чтобы просто заставить что-то работать, я беру одно учебное изображение, тренирую сеть на этом изображении некоторое время, а затем “
Data Science
Вопрос или проблема Я работаю с несбалансированным набором данных для предсказания инсультов, где положительный класс (возникновение инсульта) значительно недопредставлен. Сначала я использовал логистическую регрессию, но из-за несбалансированности классов
Data Science
Вопрос или проблема Сохранение обученной модели таким образом даст мне модель, обученную на каждом куске данных, или только на последнем куске? df = pd.read_csv(, chunksize=10000) for chunk in df: text = chunk['body'] label = chunk['user_id'] print(text.
Data Science
Вопрос или проблема У меня есть проблема с оценкой клиентов, над которой я работаю, в частности, с прогнозированием конверсии и подсчетом вероятностного балла конверсии (в данный момент используется классификатор xgboost). Есть один признак, который я
Data Science
Вопрос или проблема Обзор: Я ищу технические рекомендации от сообщества ML/науки о данных о том, как я мог бы решить свою бизнес-проблему. Контекст: В двух словах, у меня есть группа клиентов, которые неоднократно покупают продукты из определенной категории
Data Science
Вопрос или проблема Я пытаюсь предсказать вероятность выживания клиентов в течение следующих 24 месяцев. Я использую CoxTimeVaryingFitter из библиотеки lifelines. У меня есть столбец, указывающий, как долго клиенту уже предоставляются услуги (длительность отношений).
Data Science
Вопрос или проблема Я работаю с набором данных, который имеет достаточно наблюдений и около 10 переменных, половина переменных числовые другая половина переменных категориальные с 2-3 уровнями (демографические) одна переменная идентификатора одна последняя
Data Science
Вопрос или проблема Я работаю с набором данных $X$ (длиной $N$) счетных данных, который выглядит следующим образом: Я разработал статистическую модель, которую можно улучшить, поэтому я прошу любые предложения, например, разные вероятности или выбор приоритета
Data Science
Вопрос или проблема Я пытаюсь изучить логистическую регрессию. Когда я сделал целевую переменную со всеми признаками, у меня был итог, показывающий p-значения, как обычно, но один из признаков имеет 60 уровней, другой признак имеет 13 уровней.
Data Science
Вопрос или проблема У меня есть данные, похожие на рейтинги фильмов, и метки расположены в порядке, например, от 1 до 10. Поскольку целевая метка не является номинальной, а порядковой переменной, какие типы моделей мне следует использовать для классификации таких данных?
Data Science
Вопрос или проблема Я работаю с временными рядами, для которых намерен применить модель машинного обучения для обнаружения точек изменений в данных временных рядов. Эти данные записываются с машин, и нам нужно предсказать, когда процесс завершится.
Data Science
Вопрос или проблема Я пытаюсь построить регрессионное дерево с 70 атрибутами, где бизнес-команда хочет зафиксировать первые два уровня, а именно страна и тип продукта. Для достижения этой цели у меня есть два предложения: Построить отдельное дерево для
Data Science
Вопрос или проблема Я добавляю больше деталей У меня есть временной ряд данных о детях (1, 2, 3), который показывает, сколько проблем у них возникает каждую неделю (с недели 1 по неделю 80) и в каком органе (14 органов). Существуют отдельные числовые
Data Science
Вопрос или проблема Я пытаюсь понять детали моделей логистической регрессии и сейчас мне интересно, как создать модель, если у вас есть коэффициенты и перехваты. Я создал модель логистической регрессии на Python и извлек коэффициенты и перехваты.
Data Science
Вопрос или проблема Я пытаюсь построить регрессионную модель, которая оценивает объем продаж пивного продукта в конкретный день на основе цен на продукт и конкурентов, погоды, времени года и дня недели того конкретного дня. Мой вопрос заключается в том
Data Science
Вопрос или проблема Какие наборы данных используют такие сайты, как MeetGlimpse, trends.co, explodingtopics.com, чтобы обнаружить экспоненциальные рыночные тренды? Мне они нравятся (не аффилирован) и я хотел бы лучше понять, как они работают.
Data Science
Вопрос или проблема Я пытаюсь найти способ предсказать/рассчитать, как форма (например, контур ледника) изменится в будущем, исходя из ее истории (предыдущей формы) и дополнительных факторов (например, Δтемпературы). В моем примере: у меня есть форма/координаты
Data Science
Вопрос или проблема Прямой вопрос: Какие альтернативные методы существуют для прогнозирования категориальных данных? Детали: Я регулярно обрабатываю данные, которые на 100% категориальные. Почти всегда это номинальные данные (хотя иногда могут включаться
Data Science
Вопрос или проблема У меня есть несколько групп признаков, которые я хотел бы протестировать в отношении независимых переменных. Идея заключается в том, чтобы выяснить, с какими группами в большей степени ассоциируется конкретное значение независимой переменной.