machine-learning
Data Science
Вопрос или проблема Я пытаюсь построить модель, предсказывающую события оттока в будущем. Бизнес хочет иметь возможность идентифицировать, какие клиенты, вероятно, прекратят услуги в течение месяца. “В течение месяца”
Data Science
Вопрос или проблема Я работаю с данными о погоде, и у них есть несколько признаков, которые являются независимыми переменными, такими как severity, severity_id, urgency_id и т. д. … На основе этих значений я хотел бы классифицировать предупреждения на класс 0 или 1.
Data Science
Вопрос или проблема В классификации предложений с использованием предварительно обученных эмбеддингов (fasttext) в CNN, как CNN предсказывает категорию предложения, если слова не были в обучающем наборе? Я думаю, что обученная модель содержит веса, эти
Data Science
Вопрос или проблема Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их
Data Science
Вопрос или проблема Я работаю с временными рядами, для которых намерен применить модель машинного обучения для обнаружения точек изменений в данных временных рядов. Эти данные записываются с машин, и нам нужно предсказать, когда процесс завершится.
Data Science
Вопрос или проблема Я думал, что и PReLU, и Leaky ReLU это: $$f(x) = \max(x, \alpha x) \qquad \text{ где } \alpha \in (0, 1)$$ Keras, однако, имеет обе функции в документации. Leaky ReLU Исходный код LeakyReLU: return K.relu(inputs, alpha=self.
Data Science
Вопрос или проблема Как мне обучить/адаптировать модель по частям, чтобы избежать ужасной ошибки памяти? def TFIDF(X_train, X_test, MAX_NB_WORDS=75000): vectorizer_x = TfidfVectorizer(max_features=MAX_NB_WORDS) X_train = vectorizer_x.
Data Science
Вопрос или проблема Я пытаюсь построить регрессионное дерево с 70 атрибутами, где бизнес-команда хочет зафиксировать первые два уровня, а именно страна и тип продукта. Для достижения этой цели у меня есть два предложения: Построить отдельное дерево для
Data Science
Вопрос или проблема В настоящее время я заинтересован в проекте на основе wavenet, но не нашел ни одной реализации, которая даже remotely напоминает то, что рекламирует Google Deepmind здесь. Самая популярная реализация ссылается на этот пример вывода
Data Science
Вопрос или проблема Я предсказываю некоторые данные и у меня есть довольно хорошее представление о том, как должен выглядеть конечный гистограмма. Здесь сверху – “реальная истина” (должно быть то, как должны выглядеть данные). Снизу –
Data Science
Вопрос или проблема Насколько я знаю, мини-батчи могут использоваться для снижения дисперсии градиента, но я также рассматриваю, можем ли мы достичь того же результата, если мы будем использовать уменьшающийся размер шага и только один образец на каждой итерации?
Data Science
Вопрос или проблема Мы пытаемся создать рекомендательную систему для супермаркета с разнообразными типами товаров (от быстроразворачиваемых продуктов до медленноразворачивающихся электронных товаров). Некоторые товары покупаются чаще и в больших объемах
Data Science
Вопрос или проблема Я работаю с набором данных, который содержит более 100 000 записей. Вот как выглядят данные: email_id cust_id campaign_name 123 4567 World of Zoro 123 4567 Boho XYz 123 4567 Guess ABC 234 5678 Anniversary X 234 5678 World of Zoro 234
Вопросы и ответы
Вопрос или проблема В моем проекте по машинному обучению мне нужно адаптировать определенную функцию f, где в моем наборе данных я знаю только СУММУ оценок f, например, в этом случае: f(a1,b1,c1) + f(a2,b2,c2) + … = S Я знаю только сумму S, поэтому я
Data Science
Вопрос или проблема Я применяю модель CNN к своему набору данных для прогнозирования. После изменения размеров, input_shape моей модели1 становится: model1.input_shape: (None, 1, 3, 4) затем я применяю CNN, первый слой ввода определен ниже: model1.
Data Science
Вопрос или проблема Я определяю задачу классификации как задачу вычисления функции $h$, которая аппроксимирует функцию $f$, классифицирующую данные. Аппроксимация вычисляется на основе набора обучающих образцов и их классификаций по $f$ и обучения модели на этом наборе данных.
Data Science
Вопрос или проблема Я добавляю больше деталей У меня есть временной ряд данных о детях (1, 2, 3), который показывает, сколько проблем у них возникает каждую неделю (с недели 1 по неделю 80) и в каком органе (14 органов). Существуют отдельные числовые
Data Science
Вопрос или проблема Ниже описанная функция применяется в качестве процедуры фильтрации для набора клиентов, представленных значениями точности. где точность используется для измерения производительности модели. Итак, мой вопрос: Если я буду использовать
Data Science
Вопрос или проблема Я тренирую регрессионную модель (используя лес регрессии с квантилами) для прогнозирования отклонений урожайности от тренда (остатков) с использованием погодных переменных с разными временными задержками. Пытаясь улучшить точность
Data Science
Вопрос или проблема Контекст: Я работаю в индустрии ПЛК (программируемых логических контроллеров), где мы получаем схемы от клиентов, показывающие, как подключены различные устройства, и программируем ПЛК соответственно. Наша команда состоит из аналитика