Data Science
Data Science
Вопрос или проблема Я пытаюсь построить модель, предсказывающую события оттока в будущем. Бизнес хочет иметь возможность идентифицировать, какие клиенты, вероятно, прекратят услуги в течение месяца. “В течение месяца”
Data Science
Вопрос или проблема Я работаю с данными о погоде, и у них есть несколько признаков, которые являются независимыми переменными, такими как severity, severity_id, urgency_id и т. д. … На основе этих значений я хотел бы классифицировать предупреждения на класс 0 или 1.
Data Science
Вопрос или проблема В классификации предложений с использованием предварительно обученных эмбеддингов (fasttext) в CNN, как CNN предсказывает категорию предложения, если слова не были в обучающем наборе? Я думаю, что обученная модель содержит веса, эти
Data Science
Вопрос или проблема Рабочая книга Tableau, над которой я работаю, имеет разных пользователей, входящих в систему, чтобы видеть данные для своей компании. В панели инструментов я создал динамическое изображение, которое показывает логотип клиента в зависимости
Data Science
Вопрос или проблема У меня есть следующий фрейм фактической ценности, [[0.1,0.2,0.3,0.4,0.5], [0.1,0.1,0.3,0.4,0.5], [0.1,0.1,0.3,0.4,0.1], [0.1,0.3,0.3,0.4,0.5], [0.1,0.2,0.2,0.4,0.4], ] И я построил свою модель, которая предсказала значение следующим образом: [[0.
Data Science
Вопрос или проблема Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их
Data Science
Вопрос или проблема Я работаю с временными рядами, для которых намерен применить модель машинного обучения для обнаружения точек изменений в данных временных рядов. Эти данные записываются с машин, и нам нужно предсказать, когда процесс завершится.
Data Science
Вопрос или проблема В большинстве случаев все вероятно наоборот, но… Я реализовал базовую структуру многослойного перцептрона с обратным распространением. Мои данные представляют собой просто смещенную квадратную функцию с 100 образцами.
Data Science
Вопрос или проблема Я думал, что и PReLU, и Leaky ReLU это: $$f(x) = \max(x, \alpha x) \qquad \text{ где } \alpha \in (0, 1)$$ Keras, однако, имеет обе функции в документации. Leaky ReLU Исходный код LeakyReLU: return K.relu(inputs, alpha=self.
Data Science
Вопрос или проблема Как мне обучить/адаптировать модель по частям, чтобы избежать ужасной ошибки памяти? def TFIDF(X_train, X_test, MAX_NB_WORDS=75000): vectorizer_x = TfidfVectorizer(max_features=MAX_NB_WORDS) X_train = vectorizer_x.
Data Science
Вопрос или проблема Я пытаюсь построить регрессионное дерево с 70 атрибутами, где бизнес-команда хочет зафиксировать первые два уровня, а именно страна и тип продукта. Для достижения этой цели у меня есть два предложения: Построить отдельное дерево для
Data Science
Вопрос или проблема В настоящее время я заинтересован в проекте на основе wavenet, но не нашел ни одной реализации, которая даже remotely напоминает то, что рекламирует Google Deepmind здесь. Самая популярная реализация ссылается на этот пример вывода
Data Science
Вопрос или проблема Даже если временной ряд состоит только из чисел, поиск абстрактного фиксированного векторного представления был бы интересен для целей классификации/кластеризации. Поскольку мы можем обучать и находить абстрактные представления/встраивания
Data Science
Вопрос или проблема У меня есть список коротких строк, каждая из которых определяет город. Орфографические ошибки очень распространены. Пример ниже показывает некоторые из этих коротких строк и правильный город, которому они должны соответствовать.
Data Science
Вопрос или проблема Я предсказываю некоторые данные и у меня есть довольно хорошее представление о том, как должен выглядеть конечный гистограмма. Здесь сверху – “реальная истина” (должно быть то, как должны выглядеть данные). Снизу –
Data Science
Вопрос или проблема Я новичок в Python, когда я получил этот DataFrame из Yahoo Finance, столбец с датами отображается вне DataFrame. Это приводит к возникновению ошибки KeyError: ‘Date’, когда я пытаюсь выполнить эту строку кода Close_Price[‘
Data Science
Вопрос или проблема Я заметил, что модели NLP, такие как BERT, используют WordPiece для токенизации. В WordPiece мы разбиваем токены, например, playing на play и ##ing. Упоминается, что он охватывает более широкий спектр слов, находящихся вне словаря (OOV).
Data Science
Вопрос или проблема Это более общий вопрос о библиотеках Python, которые способны визуализировать сети с следующими критериями: Разный размер узлов в зависимости от метрики (например, сумма некоторой переменной X, полученной всеми остальными узлами) Направление
Data Science
Вопрос или проблема Я генерирую биграмы с помощью from gensim.models.phrases, которые буду использовать далее с TF-IDF и/или gensim.LDA from gensim.models.phrases import Phrases, Phraser # 7k документов, ~500-1k токенов каждый.
Data Science
Вопрос или проблема Я пишу статью о машинном обучении, и мне нужно создать несколько диаграмм нейронных сетей и базовые математические функции, которые я описываю. Мне нужна программа для создания визуально приемлемых технических изображений, не тратя