Data Science
Data Science
Вопрос или проблема Я пытаюсь предсказать вероятность выживания клиентов в течение следующих 24 месяцев. Я использую CoxTimeVaryingFitter из библиотеки lifelines. У меня есть столбец, указывающий, как долго клиенту уже предоставляются услуги (длительность отношений).
Data Science
Вопрос или проблема В своем исследовании я использую реализацию ядра ковариации Мatern в Numpy. Чтобы убедиться, что я понимаю, что происходит, я пытаюсь самостоятельно вывести формулы внутри реализации Numpy. Например, рассмотрим анизотропное ядро Мatern с $\nu=2.
Data Science
Вопрос или проблема Я новичок в анализе временных рядов. У меня есть несколько временных рядов (конечно, шумных), которые являются частью одного и того же набора измерений (достигнутых одновременно). Временные ряды – это результаты стохастического
Data Science
Вопрос или проблема Возможно ли обучить модель, которая обнаруживает и рисует ограничивающие рамки для объектов на столе, если я использую набор данных, где объекты на столе размечены ограничивающими рамками? Да, это возможно.
Data Science
Вопрос или проблема Я ценю тот факт, что Jupyter работает в изолированном режиме. Я уже прочитал несколько сообщений об этом. Что я не понимаю, так это почему переменная JUPYTER_PATH игнорируется, как и добавление вручную (в качестве доказательства концепции)
Data Science
Вопрос или проблема У меня есть набор данных с траекториями (несколько массивов с плавающей точкой), которые я хочу классифицировать (0 или 1, в зависимости от типа траектории). features = np.column_stack(( sat.inclinations, sat.
Data Science
Вопрос или проблема Может кто-нибудь указать мне на статью, в которой объясняется, как проходит обучение модели в Seq2Seq? Я знаю, что используется “Teacher Forcing”, но то, что я нашел до сих пор, недостаточно подробно.
Data Science
Вопрос или проблема Имеет ли смысл сначала обучить модель на изображениях из нескольких доменов, а затем провести “тонкую настройку” на одном конкретном домене, чтобы улучшить ее производительность на этом домене? Например, можно обучить детектор
Data Science
Вопрос или проблема Я пытаюсь преобразовать категориальные значения (почтовые индексы) с помощью Cat2Vec в матрицу, которая может быть использована в качестве входной формы для категориального прогнозирования целевой переменной с бинарными значениями.
Data Science
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
Вопрос или проблема Я пытаюсь проанализировать поведение, называемое “сентиментальный переворот” пользователей в наборе данных, но не могу к этому прийти. Предположим, что у меня есть две группы пользователей: хороших и плохих пользователей.
Data Science
Вопрос или проблема Я работаю над реализацией нейронной сети LSTM для прогнозирования потребления энергии. У меня есть набор данных с нагрузкой, рядами погодных параметров и индикатором выходного дня или нет. Сначала я создал сеть с входом в 24 лага (используя
Data Science
Вопрос или проблема Раньше я использовал K-кратную кросс-валидацию для надежной оценки моих моделей машинного обучения. Но я также знаю о существовании метода бутстрэппинга для этой цели. Тем не менее, я не вижу основной разницы между ними с точки зрения
Data Science
Вопрос или проблема У меня есть набор данных, который сводится к трем столбцам: 1. Название поставщика 2. Количество транзакций с поставщиком 3. Общая стоимость этих транзакций. Я пытаюсь найти лучший способ ранжирования всех поставщиков на основе этих
Data Science
Вопрос или проблема Я хочу преобразовать входные данные, доступные в формате файла C4.5, в дата-фрейм R. Набор данных можно скачать по следующей ссылке https://archive.ics.uci.edu/ml/machine-learning-databases/communities/ и он доступен в виде файлов .
Data Science
Вопрос или проблема Я ищу деревья решений, созданные экспертами в своей области на основе их опыта. Насколько я знаю, медицинские работники располагают эмпирическим деревом решений для диагностики, я хотел бы узнать, существует ли в других областях, таких
Data Science
Вопрос или проблема Я работаю с очень большим набором данных, который benefited от продолжения обучения с параметром xgb_model в xgb.train(). Метка (Y) самого набора данных имеет 4 класса и сильно несбалансирована, поэтому я хотел бы сгенерировать PR-кривые
Data Science
Вопрос или проблема Я пытаюсь создать модель для прогноза валютных курсов. Она дает многообещающие результаты для классификации каждого периода как покупка/продажа/нейтрально. При использовании в качестве классификатора фактическая доходность преобразуется
Data Science
Вопрос или проблема Это может быть необычный вопрос. У меня есть ситуация, в которой я создаю перефразировки с помощью системы на основе правил. Одно преобразование, которое я хотел бы реализовать, избавляет от легких глаголов, как так: a) Стивен сделал
Data Science
Вопрос или проблема Я ищу публичный набор данных изображений, которые отличаются друг от друга лишь незначительно, так что после применения PCA их можно будет реконструировать с небольшой ошибкой из очень небольшого количества коэффициентов PCA.