Data Science

Требуется ли масштабирование для таких наборов данных?

00

Вопрос или проблема У меня есть набор данных с такими характеристиками, как количество просмотров продукта (в сотнях тысяч), количество кликов по продуктам (в тысячах), коэффициент конверсии (в десятичном формате, например, 7,6%) и продажи (в сотнях).

Data Science

Тренды и темы искусственного интеллекта

00

Вопрос или проблема Мне интересно, существуют ли веб-сайты, с помощью которых можно постоянно быть в курсе последних тенденций или тем, связанных с разрушительными приложениями в области искусственного интеллекта. Обычно я читаю научные публикации, посвященные

Data Science

Включение структурной информации в трансформер?

03

Вопрос или проблема В задаче нейронного машинного перевода (NMT) мои входные данные содержат реляционную информацию. Эти отношения можно смоделировать с помощью графовой структуры. Один из подходов может заключаться в использовании графовой нейронной

Data Science

Распознавание форм для фигур, образованных точечными точками

00

Вопрос или проблема На изображении, в правом нижнем углу, находятся круг и треугольник, созданные с помощью набора координат. Я тщательно искал в интернете алгоритм или подход для правильной классификации формы. И все же мне ничего не удалось найти.

Data Science

Скорость для различных ядер в SVM scikit-learn

00

Вопрос или проблема Я использую scikit-learn в Python для создания моделей, пробуя разные ядра. Я был удивлён, увидев, что RBF обучается менее чем за секунду, тогда как линейная модель заняла минуту, а полиномиальная — часы. Может кто-то объяснить, почему это происходит?

Data Science

Как обрабатывать сходство слов и категоризировать группу слов в одно слово.

00

Вопрос или проблема Я новичок в этой области и довольно долго искал решения, только чтобы наткнуться на множество различных возможных подходов, но ничего конкретного. Если у меня есть список слов, скажем: email_addr, email, email_address, address или

Data Science

Градиентный бустинг – Зачем псевдо-остатки?

01

Вопрос или проблема У меня есть несколько вопросов, которые я не совсем понимаю относительно алгоритма градиентного бустинга с решающими деревьями: Имеет ли значение начальное значение как $\hat{y}$ или вы можете выбрать любое, например, между 0 и 1?

Data Science

Может ли RNN обучаться для каждого t во времени на новом наборе данных (много записей)?

00

Вопрос или проблема По сути, мой набор данных не является простым многомерным временным рядом, как это часто бывает (в какой-то степени). На каждый месяц у меня есть N записей (не менее 3000). Может ли RNN любого сорта (пожалуйста, простите мою неосведомлённость

Data Science

ValueError: Ошибка при проверке входных данных: ожидался вход dense_36_input с формой (None, 12), но получен массив с формой (140, 2)

00

Вопрос или проблема Создание модели: model=Sequential() model.add(Dense(input_dim = 12, units = 10, activation='relu', kernel_initializer="uniform")) model.add(Dense(units = 8, activation='relu', kernel_initializer="uniform")) model.

Data Science

Мне нужно обучать отдельную модель DeepFake для каждого вводимого человека?

00

Вопрос или проблема Я хотел бы создать глубокую фейковую модель конкретного человека (назовем его Стив). Затем я хотел бы иметь возможность загрузить видео любого случайного человека и заменить его лицо на лицо Стива. На данный момент я заметил, что большинство

Data Science

Связывание изменений значения во времени с известными событиями

00

Вопрос или проблема Я работаю с двумя наборами данных. Первый набор данных содержит значения флуоресценции, измеренные каждую минуту. Второй набор данных содержит определенные события и их время. Мы знаем, что эти события вызывают пики значений флуоресценции

Data Science

Техники оптимизации маркетинговых расходов

00

Вопрос или проблема Мне нужна помощь в оптимизации затрат на маркетинг. Я работаю с клиентом, который ведет оффлайн-операции, основанные в основном на онлайн-маркетинге (фейсбук, гугл, твиттер и т.д.). Они попросили меня проанализировать их маркетинговые

Data Science

Использование Keras с sklearn: применение class_weight с cross_val_score

00

Вопрос или проблема У меня имеется сильно несбалансированный набор данных (± 5% положительных экземпляров), для которого я обучаю бинарные классификаторы. Я использую вложенную 5-кратную кросс-валидацию с поиском по сетке для настройки гиперпараметров.

Data Science

Когда низкий коэффициент детерминации может создать хорошие предсказательные модели?

00

Вопрос или проблема Большинство обсуждений по поводу предсказаний моделей утверждает, что следует сосредоточиться на метриках ошибки, таких как RMSE, MSE, MAE или MAPE. Некоторые даже утверждают, что r-квадрат может быть низким в хорошей модели.

Data Science

Метрики регрессии интерпретации

00

Вопрос или проблема Я провел анализ набора данных с помощью модели случайного леса. Результаты следующие. Почему MSE крайне высок, но коэффициент детерминации (r2) показывает точность около 83-84%? Это нормально и связано с набором данных, или это указывает на проблему?

Data Science

Как выбрать подходящие предикторы для модели классификации?

01

Вопрос или проблема Я работаю над задачей классификации. У меня есть две модели: Модель логистической регрессии Модель случайного леса Для первой модели, если я выберу только предикторы с p-значениями<0.05, я снизлю точность, полноту и т.

Data Science

Плохие результаты метрик из-за сильного классового дисбаланса в классификации кредитных карт.

00

Вопрос или проблема Здравствуйте, в данный момент я пишу дипломную работу и застрял на некоторых этапах. Я разработал несколько моделей машинного обучения (XGBoost, (сбалансированный) случайный лес, ElasticNet и др.) на крайне несбалансированном наборе

Data Science

Обучение с переносом с использованием множества небольших наборов данных

00

Вопрос или проблема Контекст Я работаю над моделью обработки естественного языка (NLP), которая может классифицировать документы в одну из N категорий. У меня есть данные документов от нескольких различных клиентов. Темы документов схожи между клиентами

Data Science

Keras – метод add_weight() не добавляет к общему количеству параметров модели

00

Вопрос или проблема Я создаю пользовательский уровень Keras FConv2D() и добавляю вес в его функции build() с помощью метода add_weight(), как предложено в официальном руководстве Keras по созданию пользовательских уровней. def build(self, input_shape): shape = tf.

Data Science

Математика за этим, $MSE = смещение^2 + дисперсия$

00

Вопрос или проблема Основано на deeplearningbook: $$ \begin{align} MSE &= E[(\theta_m^{-} – \theta)^2] \\ &= Bias(\theta_m^{-})^2 + Var(\theta_m^{-})\\ \end{align} $$ где $m$ — это количество образцов в обучающем наборе, $\theta$ — это фактический