Data Science
Как предсказать события ухода, которые могут произойти в течение определенного периода времени?
00
Вопрос или проблема Я пытаюсь построить модель, предсказывающую события оттока в будущем. Бизнес хочет иметь возможность идентифицировать, какие клиенты, вероятно, прекратят услуги в течение месяца. “В течение месяца”
Data Science
Бинарная классификация для погодных данных: класс 1 или класс 0 оповещение.
00
Вопрос или проблема Я работаю с данными о погоде, и у них есть несколько признаков, которые являются независимыми переменными, такими как severity, severity_id, urgency_id и т. д. … На основе этих значений я хотел бы классифицировать предупреждения на класс 0 или 1.
Data Science
Предсказание с использованием слов, которые не входили в обучение, в сверточной нейронной сети с предварительно обученными векторными представлениями слов.
00
Вопрос или проблема В классификации предложений с использованием предварительно обученных эмбеддингов (fasttext) в CNN, как CNN предсказывает категорию предложения, если слова не были в обучающем наборе? Я думаю, что обученная модель содержит веса, эти
Data Science
Динамические изображения в Tableau
00
Вопрос или проблема Рабочая книга Tableau, над которой я работаю, имеет разных пользователей, входящих в систему, чтобы видеть данные для своей компании. В панели инструментов я создал динамическое изображение, которое показывает логотип клиента в зависимости
Data Science
вычислить метрики sklearn из двумерного массива
00
Вопрос или проблема У меня есть следующий фрейм фактической ценности, [[0.1,0.2,0.3,0.4,0.5], [0.1,0.1,0.3,0.4,0.5], [0.1,0.1,0.3,0.4,0.1], [0.1,0.3,0.3,0.4,0.5], [0.1,0.2,0.2,0.4,0.4], ] И я построил свою модель, которая предсказала значение следующим образом: [[0.
Data Science
Машинное обучение, статистика и математика
00
Вопрос или проблема Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их
Data Science
Кодирование целевой переменной для обнаружения точек изменений временных рядов
00
Вопрос или проблема Я работаю с временными рядами, для которых намерен применить модель машинного обучения для обнаружения точек изменений в данных временных рядов. Эти данные записываются с машин, и нам нужно предсказать, когда процесс завершится.
Data Science
Моя собственная нейронная сеть сходится, но модель Keras – нет.
02
Вопрос или проблема В большинстве случаев все вероятно наоборот, но… Я реализовал базовую структуру многослойного перцептрона с обратным распространением. Мои данные представляют собой просто смещенную квадратную функцию с 100 образцами.
Data Science
LeakyReLU против PReLU
00
Вопрос или проблема Я думал, что и PReLU, и Leaky ReLU это: $$f(x) = \max(x, \alpha x) \qquad \text{ где } \alpha \in (0, 1)$$ Keras, однако, имеет обе функции в документации. Leaky ReLU Исходный код LeakyReLU: return K.relu(inputs, alpha=self.
Data Science
Обучите модель глубокого обучения порциями/последовательно, чтобы избежать ошибки памяти.
00
Вопрос или проблема Как мне обучить/адаптировать модель по частям, чтобы избежать ужасной ошибки памяти? def TFIDF(X_train, X_test, MAX_NB_WORDS=75000): vectorizer_x = TfidfVectorizer(max_features=MAX_NB_WORDS) X_train = vectorizer_x.
Data Science
Исправить первые два уровня дерева решений?
00
Вопрос или проблема Я пытаюсь построить регрессионное дерево с 70 атрибутами, где бизнес-команда хочет зафиксировать первые два уровня, а именно страна и тип продукта. Для достижения этой цели у меня есть два предложения: Построить отдельное дерево для
Data Science
Существует ли хорошо работающая реализация WaveNet, доступная общественности?
00
Вопрос или проблема В настоящее время я заинтересован в проекте на основе wavenet, но не нашел ни одной реализации, которая даже remotely напоминает то, что рекламирует Google Deepmind здесь. Самая популярная реализация ссылается на этот пример вывода
Data Science
Как получить векторные представления (или эмбеддинги) временных рядов?
00
Вопрос или проблема Даже если временной ряд состоит только из чисел, поиск абстрактного фиксированного векторного представления был бы интересен для целей классификации/кластеризации. Поскольку мы можем обучать и находить абстрактные представления/встраивания
Data Science
Классификация коротких строк текста с дополнительным контекстом
00
Вопрос или проблема У меня есть список коротких строк, каждая из которых определяет город. Орфографические ошибки очень распространены. Пример ниже показывает некоторые из этих коротких строк и правильный город, которому они должны соответствовать.
Data Science
Лучший способ подогнать данные из одной гистограммы в другую?
00
Вопрос или проблема Я предсказываю некоторые данные и у меня есть довольно хорошее представление о том, как должен выглядеть конечный гистограмма. Здесь сверху – “реальная истина” (должно быть то, как должны выглядеть данные). Снизу –
Data Science
Данные, полученные вне Pandas DataFrame
00
Вопрос или проблема Я новичок в Python, когда я получил этот DataFrame из Yahoo Finance, столбец с датами отображается вне DataFrame. Это приводит к возникновению ошибки KeyError: ‘Date’, когда я пытаюсь выполнить эту строку кода Close_Price[‘
Data Science
Как токенизация WordPiece помогает эффективно справляться с проблемой редких слов в НЛП?
00
Вопрос или проблема Я заметил, что модели NLP, такие как BERT, используют WordPiece для токенизации. В WordPiece мы разбиваем токены, например, playing на play и ##ing. Упоминается, что он охватывает более широкий спектр слов, находящихся вне словаря (OOV).
Data Science
Библиотека визуализации для сетей и зависимостей
00
Вопрос или проблема Это более общий вопрос о библиотеках Python, которые способны визуализировать сети с следующими критериями: Разный размер узлов в зависимости от метрики (например, сумма некоторой переменной X, полученной всеми остальными узлами) Направление
Data Science
Как выбрать порог для Phrases в gensim при генерации биграмм?
00
Вопрос или проблема Я генерирую биграмы с помощью from gensim.models.phrases, которые буду использовать далее с TF-IDF и/или gensim.LDA from gensim.models.phrases import Phrases, Phraser # 7k документов, ~500-1k токенов каждый.
Data Science
Какую программу использовать для визуализации диаграммы нейронной сети и математических функций.
00
Вопрос или проблема Я пишу статью о машинном обучении, и мне нужно создать несколько диаграмм нейронных сетей и базовые математические функции, которые я описываю. Мне нужна программа для создания визуально приемлемых технических изображений, не тратя