Data Science
Анализ прогнозов выживания вне выборки (CoxTimeVaryingFitter)
00
Вопрос или проблема Я пытаюсь предсказать вероятность выживания клиентов в течение следующих 24 месяцев. Я использую CoxTimeVaryingFitter из библиотеки lifelines. У меня есть столбец, указывающий, как долго клиенту уже предоставляются услуги (длительность отношений).
Data Science
Реализация производной ковариационного ядра Мatern на Numpy
00
Вопрос или проблема В своем исследовании я использую реализацию ядра ковариации Мatern в Numpy. Чтобы убедиться, что я понимаю, что происходит, я пытаюсь самостоятельно вывести формулы внутри реализации Numpy. Например, рассмотрим анизотропное ядро Мatern с $\nu=2.
Data Science
Определите окно временного ряда “стационарного состояния”
00
Вопрос или проблема Я новичок в анализе временных рядов. У меня есть несколько временных рядов (конечно, шумных), которые являются частью одного и того же набора измерений (достигнутых одновременно). Временные ряды – это результаты стохастического
Data Science
Обнаружение объектов на столе
00
Вопрос или проблема Возможно ли обучить модель, которая обнаруживает и рисует ограничивающие рамки для объектов на столе, если я использую набор данных, где объекты на столе размечены ограничивающими рамками? Да, это возможно.
Data Science
Местоположение пакетов сайта не разделяется между Python и Jupyter Lab.
00
Вопрос или проблема Я ценю тот факт, что Jupyter работает в изолированном режиме. Я уже прочитал несколько сообщений об этом. Что я не понимаю, так это почему переменная JUPYTER_PATH игнорируется, как и добавление вручную (в качестве доказательства концепции)
Data Science
Моя модель LSTM RNN всегда выдает один и тот же результат для каждого предсказания, что я могу сделать?
00
Вопрос или проблема У меня есть набор данных с траекториями (несколько массивов с плавающей точкой), которые я хочу классифицировать (0 или 1, в зависимости от типа траектории). features = np.column_stack(( sat.inclinations, sat.
Data Science
Обучение модели Seq2Seq: Кодировщик против Декодировщика
00
Вопрос или проблема Может кто-нибудь указать мне на статью, в которой объясняется, как проходит обучение модели в Seq2Seq? Я знаю, что используется “Teacher Forcing”, но то, что я нашел до сих пор, недостаточно подробно.
Data Science
Тренируйтесь на нескольких доменах, затем донастройтесь на конкретном домене.
00
Вопрос или проблема Имеет ли смысл сначала обучить модель на изображениях из нескольких доменов, а затем провести “тонкую настройку” на одном конкретном домене, чтобы улучшить ее производительность на этом домене? Например, можно обучить детектор
Data Science
Реализация Cat2Vec X = категориальный, y = категориальный
00
Вопрос или проблема Я пытаюсь преобразовать категориальные значения (почтовые индексы) с помощью Cat2Vec в матрицу, которая может быть использована в качестве входной формы для категориального прогнозирования целевой переменной с бинарными значениями.
Data Science
Является ли дисперсия пропорциональной максимальному расстоянию между образцами распределения?
00
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
измерение поведения флippers по нескольким темам
00
Вопрос или проблема Я пытаюсь проанализировать поведение, называемое “сентиментальный переворот” пользователей в наборе данных, но не могу к этому прийти. Предположим, что у меня есть две группы пользователей: хороших и плохих пользователей.
Data Science
LSTM с входом фактического временного шага
00
Вопрос или проблема Я работаю над реализацией нейронной сети LSTM для прогнозирования потребления энергии. У меня есть набор данных с нагрузкой, рядами погодных параметров и индикатором выходного дня или нет. Сначала я создал сеть с входом в 24 лага (используя
Data Science
В чем разница между бутстрэппингом и кросс-валидацией?
00
Вопрос или проблема Раньше я использовал K-кратную кросс-валидацию для надежной оценки моих моделей машинного обучения. Но я также знаю о существовании метода бутстрэппинга для этой цели. Тем не менее, я не вижу основной разницы между ними с точки зрения
Data Science
Как на нормализацию влияют выбросы? И как их избежать?
00
Вопрос или проблема У меня есть набор данных, который сводится к трем столбцам: 1. Название поставщика 2. Количество транзакций с поставщиком 3. Общая стоимость этих транзакций. Я пытаюсь найти лучший способ ранжирования всех поставщиков на основе этих
Data Science
Импорт файла C4.5 в датафрейм R
00
Вопрос или проблема Я хочу преобразовать входные данные, доступные в формате файла C4.5, в дата-фрейм R. Набор данных можно скачать по следующей ссылке https://archive.ics.uci.edu/ml/machine-learning-databases/communities/ и он доступен в виде файлов .
Data Science
Дерево решений из опыта эксперта
00
Вопрос или проблема Я ищу деревья решений, созданные экспертами в своей области на основе их опыта. Насколько я знаю, медицинские работники располагают эмпирическим деревом решений для диагностики, я хотел бы узнать, существует ли в других областях, таких
Data Science
Как сделать классификаторы 1-против-остальных в библиотеке XGBoost (не Sklearn)?
00
Вопрос или проблема Я работаю с очень большим набором данных, который benefited от продолжения обучения с параметром xgb_model в xgb.train(). Метка (Y) самого набора данных имеет 4 класса и сильно несбалансирована, поэтому я хотел бы сгенерировать PR-кривые
Data Science
Модель Tensorflow работает для классификации, но не для регрессии (все предсказания равны смещению выходного слоя).
00
Вопрос или проблема Я пытаюсь создать модель для прогноза валютных курсов. Она дает многообещающие результаты для классификации каждого периода как покупка/продажа/нейтрально. При использовании в качестве классификатора фактическая доходность преобразуется
Data Science
Изменение словоизменений
00
Вопрос или проблема Это может быть необычный вопрос. У меня есть ситуация, в которой я создаю перефразировки с помощью системы на основе правил. Одно преобразование, которое я хотел бы реализовать, избавляет от легких глаголов, как так: a) Стивен сделал
Data Science
Набор данных с чрезвычайно низкоразмерными изображениями для PCA
00
Вопрос или проблема Я ищу публичный набор данных изображений, которые отличаются друг от друга лишь незначительно, так что после применения PCA их можно будет реконструировать с небольшой ошибкой из очень небольшого количества коэффициентов PCA.