Data Science
Существует ли подходящий тест гипотезы: Два образца, один из которых состоит только из одной точки данных, ненормальный?
00
Вопрос или проблема У меня есть два “образца”. Первый состоит примерно из 400 физических измерений величины (взятых за один час, и реальная ситуация не является стационарной). Они показывают сильно скошенное распределение, для которого теоретическая
Data Science
Почему мои предсказания неверны при выполнении сегментации изображений с помощью TensorFlow?
00
Вопрос или проблема Я пытаюсь выполнить семантическую сегментацию изображений с помощью TensorFlow. Чтобы просто заставить что-то работать, я беру одно учебное изображение, тренирую сеть на этом изображении некоторое время, а затем “
Data Science
Несбалансированный класс в моем наборе данных
00
Вопрос или проблема Я работаю с несбалансированным набором данных для предсказания инсультов, где положительный класс (возникновение инсульта) значительно недопредставлен. Сначала я использовал логистическую регрессию, но из-за несбалансированности классов
Data Science
Обновите сохранённую модель после тренировки.
00
Вопрос или проблема Сохранение обученной модели таким образом даст мне модель, обученную на каждом куске данных, или только на последнем куске? df = pd.read_csv(, chunksize=10000) for chunk in df: text = chunk['body'] label = chunk['user_id'] print(text.
Data Science
Инженерия признаков: признак свежести
00
Вопрос или проблема У меня есть проблема с оценкой клиентов, над которой я работаю, в частности, с прогнозированием конверсии и подсчетом вероятностного балла конверсии (в данный момент используется классификатор xgboost). Есть один признак, который я
Data Science
Определение участников, которые, вероятно, перейдут на продукт с более низкой стоимостью.
00
Вопрос или проблема Обзор: Я ищу технические рекомендации от сообщества ML/науки о данных о том, как я мог бы решить свою бизнес-проблему. Контекст: В двух словах, у меня есть группа клиентов, которые неоднократно покупают продукты из определенной категории
Data Science
Анализ прогнозов выживания вне выборки (CoxTimeVaryingFitter)
00
Вопрос или проблема Я пытаюсь предсказать вероятность выживания клиентов в течение следующих 24 месяцев. Я использую CoxTimeVaryingFitter из библиотеки lifelines. У меня есть столбец, указывающий, как долго клиенту уже предоставляются услуги (длительность отношений).
Data Science
Как решить, кого продвигать? Кластеризация или дерево решений?
00
Вопрос или проблема Я работаю с набором данных, который имеет достаточно наблюдений и около 10 переменных, половина переменных числовые другая половина переменных категориальные с 2-3 уровнями (демографические) одна переменная идентификатора одна последняя
Data Science
Модель Пуассона с переизбыточностью
00
Вопрос или проблема Я работаю с набором данных $X$ (длиной $N$) счетных данных, который выглядит следующим образом: Я разработал статистическую модель, которую можно улучшить, поэтому я прошу любые предложения, например, разные вероятности или выбор приоритета
Data Science
Логистическая регрессия Многоуровневые независимые переменные
00
Вопрос или проблема Я пытаюсь изучить логистическую регрессию. Когда я сделал целевую переменную со всеми признаками, у меня был итог, показывающий p-значения, как обычно, но один из признаков имеет 60 уровней, другой признак имеет 13 уровней.
Data Science
Как классифицировать упорядоченные метки (ординальные данные)?
00
Вопрос или проблема У меня есть данные, похожие на рейтинги фильмов, и метки расположены в порядке, например, от 1 до 10. Поскольку целевая метка не является номинальной, а порядковой переменной, какие типы моделей мне следует использовать для классификации таких данных?
Data Science
Кодирование целевой переменной для обнаружения точек изменений временных рядов
00
Вопрос или проблема Я работаю с временными рядами, для которых намерен применить модель машинного обучения для обнаружения точек изменений в данных временных рядов. Эти данные записываются с машин, и нам нужно предсказать, когда процесс завершится.
Data Science
Исправить первые два уровня дерева решений?
00
Вопрос или проблема Я пытаюсь построить регрессионное дерево с 70 атрибутами, где бизнес-команда хочет зафиксировать первые два уровня, а именно страна и тип продукта. Для достижения этой цели у меня есть два предложения: Построить отдельное дерево для
Data Science
Прогноз: подключить таблицу корреляции (нейрон) к нейрону временных рядов в Keras/TF
00
Вопрос или проблема Я добавляю больше деталей У меня есть временной ряд данных о детях (1, 2, 3), который показывает, сколько проблем у них возникает каждую неделю (с недели 1 по неделю 80) и в каком органе (14 органов). Существуют отдельные числовые
Data Science
Создание модели логистической регрессии с коэффициентами
00
Вопрос или проблема Я пытаюсь понять детали моделей логистической регрессии и сейчас мне интересно, как создать модель, если у вас есть коэффициенты и перехваты. Я создал модель логистической регрессии на Python и извлек коэффициенты и перехваты.
Data Science
Разделение данных на обучающую и тестовую выборки для регрессии
00
Вопрос или проблема Я пытаюсь построить регрессионную модель, которая оценивает объем продаж пивного продукта в конкретный день на основе цен на продукт и конкурентов, погоды, времени года и дня недели того конкретного дня. Мой вопрос заключается в том
Data Science
Какие наборы данных помогут предсказать (экспоненциальные) рыночные тренды?
00
Вопрос или проблема Какие наборы данных используют такие сайты, как MeetGlimpse, trends.co, explodingtopics.com, чтобы обнаружить экспоненциальные рыночные тренды? Мне они нравятся (не аффилирован) и я хотел бы лучше понять, как они работают.
Data Science
Прогнозирование изменения форм/координат
00
Вопрос или проблема Я пытаюсь найти способ предсказать/рассчитать, как форма (например, контур ледника) изменится в будущем, исходя из ее истории (предыдущей формы) и дополнительных факторов (например, Δтемпературы). В моем примере: у меня есть форма/координаты
Data Science
Альтернативы для категориального предсказания
00
Вопрос или проблема Прямой вопрос: Какие альтернативные методы существуют для прогнозирования категориальных данных? Детали: Я регулярно обрабатываю данные, которые на 100% категориальные. Почти всегда это номинальные данные (хотя иногда могут включаться
Data Science
Отношения между группами признаков и независимыми переменными
00
Вопрос или проблема У меня есть несколько групп признаков, которые я хотел бы протестировать в отношении независимых переменных. Идея заключается в том, чтобы выяснить, с какими группами в большей степени ассоциируется конкретное значение независимой переменной.